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文艺 复兴 以 来 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规范 ， 使 西方 国家 在 目 然 科学 的 各 
个 领域 取得 了 垄断 性 的 优势 ， 也 正 是 这 样 的 优势 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 家 面 
出 、 独 领 风 骚 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧密 地 结合 ， 计 算 机 学 科 中 
的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科学 著作 ， 不 仅 璧 划 了 研究 
的 范畴 ， 还 揭示 了 学 术 的 源 变 ， 既 遵循 学 术 规范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 因 年 月 的 流 
逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 潮 的 推动 下 ,我 国 的 计算 机 产业 发 展 迅 猛 ， 对 专业 人 才 的 需求 日 益 
迫切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ; 而 专业 教材 的 建设 在 教育 战略 上 显 
得 举足轻重 。 在 我 国信 息 技 术 发 展 时 间 较 短 的 现状 下 ， 美 国 等 发 达 国 家 在 其 计算 机 科学 发 展 的 
几 十 年 间 积淀 和 发 展 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国外 优秀 计算 机 教材 
将 对 我 国 计 算 机 教育 事业 的 发 展 起 到 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 设 真正 的 世界 一 流 
大 学 的 必由之路 。 

机 械 工业 出 版 社 华章 公司 较 早 意识 到 “出 版 要 为 教育 服务 ”。 自 1998 年 开始 ， 我 们 
就 将 工作 重点 放 在 了 六 选 、 移 译 国 外 优秀 教材 上 。 经 过 多 年 的 不 懈 努 力 ， 我 们 与 Pearson， 
McGraw-Hill, Elsevier, MIT, John Wiley & Sons, Cengage 等 世界 著名 出 版 公司 建立 了 良好 的 
合作 关系 ,从 他 们 现 有 的 数 百 种 教材 中 疆 选 出 Andrew S. Tanenbaum, Bjarne Stroustrup, Brain 
W. Kernighan, Dennis Ritchie, Jim Gray，Afred V. Aho, John E. Hopcroft, Jeffrey D. Ullman, 
Abraham Silberschatz, William Stallings, Donald E. Knuth, John L. Hennessy, Larry L. Peterson 
等 大 师 名 家 的 一 批 经 典 作品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 学 习 、 研 究 及 珍藏 。 
大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 从 书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 易 力 相助 ， 国 内 的 专家 不 仅 提供 了 中 
肯 的 选 题 指导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ; 而 原 书 的 作者 也 相当 关注 其 作品 在 中 
AME, ANB AAA PRATER. >, “计算机 科学 丛书 ”已 经 出 版 了 近 两 百 个 
品种 ， 这 些 书 籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采 用 为 正式 教材 和 参考 书籍 。 其 影 
印 版 “经 典 原版 书库 ”作为 姊妹 篇 也 被 越 来 越 多 实施 双语 教学 的 学 校 所 采用 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因 素 使 我 们 的 图 
书 有 了 质量 的 保证 。 随 着 计算 机 科学 与 技术 专业 学 科 建 设 的 不 断 完 善 和 教材 改革 的 逐渐 深化 ， 
教育 界 对 国外 计算 机 教材 的 需求 和 应 用 都 将 步 和 人 一 个 新 的 阶段 ， 我 们 的 目标 是 尽善尽美 ， 而 反 
馈 的 意见 正 是 我 们 达到 这 一 终极 目标 的 重要 帮助 。 华 章 公司 欢迎 老师 和 读者 对 我 们 的 工作 提出 
建议 或 给 予 指正 ,我们 的 联系 方法 如 下 : 


化 章 网 站 :; www.hzbook.com 
电子 邮件 : hzjsj@hzbook.com 
联系 电话 : (010) 88379604 
联系 地 址 ， 北 京 市 西城 区 百 万 庄 南 街 1 号 
邮政 编码 : 100037 华章 科技 图 书 出 版 中 心 
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随 着 信息 社会 的 到 来 ， 数 据 日 益 成 为 宝贵 的 资源 ， 数 据 库 作 为 数据 管理 的 基本 技术 和 
工具 ， 正 广泛 应 用 于 各 行 各 业 。 然 而 ， 正 如 本 书 作 者 在 前 言 中 所 述 :“ 遗 憾 的 是 ， 正 是 由 于 
数据 库 系统 的 简单 性 ， 许 多 用 户 有 可 能 尚 缺 乏 必 要 的 知识 ， 还 不 懂得 如 何 开发 正确 且 高 效 的 
系统 ， 就 开始 创建 数据 库 及 其 应 用 程序 了 。” 本 书 的 目标 就 是 以 读者 易于 接受 和 理解 的 方式 
介绍 数据 库 设计 、 实 现 和 管理 的 基本 理论 、 方 法 和 技术 。 本 书 既 涵盖 了 数据 库 领 域 的 经 典 内 
容 ， 又 反映 了 近期 的 研究 成 果 ， 特 别 是 为 数据 库 概念 设计 、 逻 辑 设 计 和 物理 设计 提供 了 步骤 
完备 的 方法 学 ,非常 有 实用 价值 。2004 年 我 们 兽 翻 译本 书 的 第 3 版 ， 广 受 读 者 欢迎 ， 后 来 
的 第 4 版 、 第 5 版 扩充 了 数据 库 领 域 的 新 技术 ， 特 别 是 随 着 互联 网 、 移 动 计 算 的 发 展 衍生 出 
来 的 应 用 技术 ， 并 增强 了 可 读 性 。 第 6 版 增加 了 云 计 算 、 时 态 数 据 库 等 内 容 ， 充 实 了 第 21 
章 “ 数 据 管理 中 的 职业 、 法 律 与 道德 问题 ”， 与 SQL 相关 的 章节 全 面 更 新 为 2011 年 公布 的 
新 标准 SQL:2011。 

本 书 的 两 位 作者 均 具 有 丰富 的 数据 库 管理 系统 和 数据 库 应 用 系统 的 设计 经 验 ， 托 马 
斯 M. EAI (Thomas M. Connolly) 曾 参 与 设计 世界 上 第 一 个 商业 可 移动 数据 库 管 理 系统 
RAPPORT 和 配置 管理 工具 LIFESPAN， 后 者 获 英 国 设计 奖 ; 卡 洛 琳 E. 贝 格 (Carolyn E. 
Begg) 则 是 数据 库 技 术 应 用 于 生物 领域 的 专家 。 

本 书 系统 性 强 、 结 构 清晰 ， 特 别 注 重 理论 联系 实际 ， 并 以 一 个 可 运行 的 DreamHome ( 房 
屋 租 赁 公司 ) 案例 贯穿 全 书 , 便于 阅读 和 理解 。 本 书 既 可 作为 计算 机 及 相关 专业 本 科 生 数据 
库 管 理 或 数据 库 设 计 的 导论 性 教材 (选取 部 分 内 容 )， 也 可 作为 研究 生 或 高 年 级 本 科 生 相关 
课程 的 教材 ， 亦 可 作为 IT 专业 人 士 (包括 系统 分 析 和 设计 人 员 、 应 用 程序 开发 人 员 、 系 统 
程序 员 、 数 据 库 从 业 人 员 及 独立 的 自学 者 ) 的 参考 书 。 

中 文 版 分 为 两 册 ， 共 九 个 部 分 。 本 书 为 基础 篇 ， 包 括 原 书 的 前 五 部 分 : 第 一 部 分 概述 数 
据 库 系统 和 数据 库 设 计 的 基础 知识 ; 第 二 部 分 讨论 关系 模型 与 语言 ; 第 三 部 分 讨论 数据 库 分 
析 和 设计 的 主要 技术 ; 第 四 部 分 结合 实例 讲解 数据 库 设 计 方 法 学 ， 提 供 详细 的 步骤 解析 ; 第 
五 部 分 讨论 四 个 可 选 专题 ， 涵 盖 数 据 库 安全 、 法 律 与 道德 问题 :事务 管理 和 查询 处 理 。 

宁 洪 教授 全 面 负责 本 书 的 翻译 ， 贾 丽 丽 提供 了 第 三 、 四 、 五 部 分 的 大 部 分 初稿 ， 张 元 昭 
提供 了 第 二 部 分 的 大 部 分 初稿 ， 全 书 由 宁 洪 教授 统 稿 并 审 校 。 

限于 译 者 水 平 ， 译 文中 的 玻 漏 和 错误 在 所 难免 ， 欢 迎 批评 指正 。 

本 书 是 在 2004 年 翻译 的 第 3 版 的 基础 上 完成 的 ， 借 此 机 会 向 参与 第 3 版 翻译 工作 的 其 
他 译 者 致谢 。 


译 者 
国防 科技 大 学 计算 机 科学 与 技术 系 
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在 过 去 的 30 年 中 ， 数 据 库 的 研究 带 来 了 巨大 的 生产 力 ， 使 得 数据 库 系 统 成 为 软件 工程 
领域 最 重要 的 成 果 。 有 目前， 数据 库 作 为 信息 系统 的 基本 框架 ， 已 从 根本 上 改变 了 许多 公司 的 
运作 方式 。 特 别 是 在 最 近 几 年 里 ， 随 着 这 项 技术 本 身 的 发 展 ， 产 生 了 一 些 功能 更 强大 、 使 
用 更 方便 的 系统 。 这 使 得 数据 库 系统 变 得 越 来 越 普 及 ， 用 户 类 型 也 越 来 越 广泛 。 遗 憾 的 是 ， 
正 是 由 于 数据 库 系 统 的 简单 性 ， 许 多 用 户 有 可 能 尚 缺 乏 必 要 的 知识 ， 还 不 懂得 如 何 开发 正 
确 且 高 效 的 系统 ， 就 开始 创建 数据 库 及 其 应 用 程序 了 。 这 样 很 可 能 导致 所 谓 的 “软件 危机 - 
(software crisigs ， 有 时 也 称 为 “软件 抑郁 ”(software depression) ) 的 延续 。 

编写 本 书 的 最 初 动因 是 我 们 在 工业 界 的 工作 经 历 ， 当 时 我 们 为 新 软件 系统 中 数据 库 的 
设计 提供 咨询 ， 间 或 也 解决 遗留 系统 中 存在 的 种 种 问题 。 进 入 学 术 界 后 ,我 们 从 男 一 类 用 
户 一 一 学 生 那 里 发 现 了 类 似 的 问题 。 因 此 ， 本 书 的 目标 就 是 给 出 一 本 教程 ， 尽 可 能 清楚 地 介 
绍 数据 库 的 基础 理论 ， 并 给 出 一 套 既 能 为 专业 技术 人 员 亦 能 为 非 技术 人 员 所 用 的 数据 库 设计 
方法 学 ; 

本 书 针对 当前 主流 的 商用 产品 关系 数据 库 管理 系统 (DBMS) 给 出 的 设计 方法 学 ， 
已 在 学 术 界 和 工业 界 测 试 和 使 用 了 许多 年 。 它 包括 三 个 主要 阶段 : 数据 库 的 概念 设计 、 逻 辑 
设计 和 物理 设计 。 第 一 个 阶段 在 不 考虑 任何 物理 因素 的 前 提 下 设计 概念 数据 模型 ， 得 到 的 数 
据 模型 在 第 二 阶段 被 细 化 为 逻辑 数据 模型 ， 细 化 过 程 主要 是 去 除 在 关系 系统 中 无 法 表示 的 结 
构 。 在 第 三 阶段 ,逻辑 数据 模型 被 转换 成 针对 目标 DBMS 的 物理 设计 ， 物 理 设 计 阶段 主要 
考虑 如 何 设计 存储 结构 和 访问 方法 ， 以 便 有 效 并 安全 地 访问 存储 在 辅 存 中 的 数据 库 。 

该 方法 学 按 阶段 被 分 为 一 系列 步 又。 对 于 缺少 经 验 的 设计 者 ， 最 好 按 步骤 进行 设计 ， 这 
里 所 提供 的 指南 可 帮助 你 完成 整个 过 程 。 对 于 有 经 验 的 设计 者 ， 该 方法 学 的 指导 作用 显然 会 
弱化 ， 但 经 常 可 用 于 开发 框架 和 检查 列表 。 为 了 帮助 读者 学 习 使 用 上 述 方法 学 并 理解 其 要 
点 ， 整 个 方法 学 的 描述 中 始终 贯穿 一 个 完整 的 DreamHome 案例 研究 。 附 录 BRAM FAM 
三 个 案例 ， 供 读者 自行 研究 。 


UML (统一 建 模 语言 


越 来 越 多 的 公司 都 在 规范 各 自 的 数据 建 模 方法 ， 即 选择 一 种 特定 的 建 模 方法 并 在 整个 数 
据 库 开 发 项 目 中 始终 如 一 地 使 用 它 。 一 种 在 数据 库 概 念 设 计 和 逻辑 设计 阶段 较为 通用 的 高 级 
数据 模型 是 ER (实体 - 联系 ) 模型 ， 这 也 是 本 书 采用 的 模型 。 由 于 当前 还 没有 表示 ER 模型 
的 标准 方法 ， 因 此 大 部 分 书籍 在 描述 关系 DBMS 的 数据 库 设 计时 ， 常 常 使 用 下 述 两 种 表示 
方法 之 一 : 

© Chen 氏 表 示 方 法 ， 即 用 和 矩形 表示 实体 ， 用 菱形 表示 联系 ， 用 线段 连接 矩形 和 委 形 。 

© Crow Feet (FUN) 表示 方法 ， 仍 用 和 矩形 表示 实体 ， 用 实体 间 的 连 线 表示 联系 ， 在 一 对 

多 联系 连 线 的 多 顺 有 一 个 胖 爪 标记 。 
当前 ， 这 两 种 表示 方法 都 有 计算 机 辅助 软件 工程 (CASE) 工具 。 然 而 ， 它 们 都 难于 使 





用 和 解释 。 本 书 的 较 早 版 本 曾 使 用 Chen 氏 表 示 方 法 ， 而 在 随后 培 生 教育 出 版 集团 进行 的 一 
次 问卷 调查 中 ， 比 较 一 致 的 意见 是 应 该 使 用 最 新 的 称 为 UML (Unified Modeling Language, 
统一 建 模 语 言 ) 的 面向 对 象 建 模 语言 。UML 表示 方法 结合 了 面向 对 象 设 计 三 大 流派 的 成 分 : 
Rumbaugh 的 OMT 建 模 语 言 ，Booch 的 面向 对 象 分 析 和 面向 对 象 设 计 ， 以 及 Jacobson 的 
Objectory。 

换 用 表示 方法 主要 有 以 下 三 个 原因 : (1) UML 正成 为 一 种 工业 标准 ， 例 如 ， 对 象 管理 
组 (OMG) 已 经 采纳 UML 作为 对 象 方法 的 标准 表示 方法 ; (2) UML 表达 清楚 并 易于 使 用 ; 
(3) UML 目前 已 被 学 术 界 用 于 面向 对 象 分 析 与 设计 的 教学 ， 在 数据 库 模 块 的 教学 中 也 使 用 
UML 将 会 更 加 一 致 。 因 此 ， 在 这 个 版 本 中 ， 我们 将 采用 UML 的 类 图 作为 ER 模型 的 表示 方 
法 。 读 者 将 会 发 现 这 种 表示 方法 更 加 容易 理解 和 使 用 。 


第 6 版 的 更 新 之 处 


e 扩展 了 第 3 章 “ 数 据 库 的 结构 与 Web”， 增 加 了 云 计 算 。 

e 修改 了 第 21 章 “数据 管理 中 的 职业 、 法 律 与 道德 问题 ”。 

e 增加 了 “数据 仓库 与 时 态 数 据 库 ”( 31.5 节 )。 

e 每 章 后 增加 了 新 的 思考 题 和 习题 。 

e 修改 了 与 SQL 相关 的 章节 ， 全 面 反 映 2011 年 公布 的 新 标准 SQL:2011。 

e 修订 了 第 26 章 “ 复 制 与 移动 数据 库 ” 。 

e 修改 了 关于 Web-DBMS 集成 和 XML 的 章节 。 

e 5 Oracle 相关 的 内 容 一 律 修改 为 针对 Oracle 11g. 
读者 对 象 

本 书 可 作为 本 科 生 数据 库 管 理 或 数据 库 设 计 的 导论 性 教材 ， 也 可 作为 研究 生 或 高 年 级 本 
科 生 相关 课程 的 教材 ， 学 时 可 分 为 一 到 两 个 学 期 。 通 常 信 息 系统 、 商 业 IT 或 计算 机 科学 等 
专业 都 包含 这 类 课程 。 

本 书 还 可 以 作为 一 些 IT 专业 人 士 的 参考 书 ， 如 系统 分 析 和 设计 人 员 、 应 用 程序 开发 人 
员 、 系 统 程序 员 、 数 据 库 从 业 人 员 及 独立 的 自学 者 。 随 着 当今 数据 库 系统 的 广泛 使 用 ， 这 些 
专业 人 士 可 能 来 自 于 需要 数据 库 的 任何 类 型 的 公司 。 

读者 在 学 习 关 于 物理 数据 库 设 计 的 第 18 章 和 关于 查询 处 理 的 第 23 章 之 前 ， 如 果 对 附录 
F 中 介绍 的 文件 组 织 和 数据 结构 相关 概念 有 清楚 的 了 解 ， 那 么 将 会 有 所 帮助 。 理 想 的 情况 是 
这 些 痛 景 知识 已 从 前 导 课 程 中 获得 。 如 果 不 具备 这 个 条 件 ， 则 可 以 在 开始 数据 库 课 程 后， 学 
完 第 1 章 立 即 学 习 附 录 下。 

如 果 读 者 已 经 掌握 了 一 门 高 级 编程 语言 ， 比 如 C， 那 么 在 学 习 附 录 工 的 和 衣 人 式 与 动态 
SQL 和 28.3 节 的 ObjectStore 时 会 更 有 成 效 。 
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C1) AAEE BP ABE as BCT He HT A BART ENTIRE, TEE Z 
采用 的 实体 - 联系 模型 并 将 规范 化 作为 验证 技术 。 此 外 ， 通 过 一 个 完整 的 案例 研究 来 说 明 如 
何 使 用 这 套 方法 学 。 

(2) 为 数据 库 物 理 设 计 提 供 了 易 用 、 逐 步 指导 的 方法 学 ,包括 : 逻辑 设计 到 物理 实现 的 


上 映射， 文件 组 织 方法 的 选择 ， 适 合 应 用 程序 的 索引 结构 ， 以 及 何 时 引入 可 控 元 余 。 此 外 , 通 
过 一 个 完整 的 案例 研究 来 说 明 如 何 使 用 这 套 方法 学 。 

(3 ) 用 独立 的 章节 来 讲解 以 下 三 个 主题 : 数据 库 设计 阶段 在 整个 系统 开发 生命 周期 中 的 
位 置 与 作用 ; 如 何 使 用 实况 发 现 技 术 来 获取 系统 需求 ; 如 何 将 UML 用 于 整个 方法 学 。 

(4) 每 章 都 采用 清晰 且 易 于 理解 的 表述 方法 ， 如 突出 显示 定义 ， 明 确 给 出 各 章 学 习 
目标 ， 在 各 章 最 后 进行 小 结 。 通 篇 使 用 了 大 量 示例 和 图 表 来 说 明 概 念 。 来 自 现实 生活 的 
DreamHome 案例 研究 贯穿 全 书 ， 另 外 还 给 出 若干 案例 供 学 生 选 作 课 程 实践 题目 。 

(5) 扩充 了 下 列 最 新 的 正式 标准 及 事实 标准 : 结构 化 查询 语言 (SQL)， 举 例 查询 
(QBE)， 面 向 对 象 数 据 库 的 对 象 数 据 管 理 组 (ODMG) 标准 。 

(6) 利用 三 章 的 篇 幅 ， 以 教程 式 风 格 介绍 SQL 标准 ， 包 含 交互 式 和 舱 人 式 SQL. 

(7) 专 设 一 章 讨 论 IT 和 数据 库 中 的 职业 、 法 律 与 道德 问题 。 

(8) 全 面 讨 论 了 与 分 布 式 DBMS 和 复制 服务 器 相关 的 概念 和 问题 。 

(9) 全 面 介绍 了 基于 对 象 的 DBMS 中 的 一 些 概 念 和 问题 。 回 顾 了 ODMG 标准 ， 介 绍 了 
在 最 新 公布 的 SQL 版 本 SQL:2011 中 出 现 的 各 种 对 象 管理 机 制 。 

(10) 扩展 了 作为 数据 库 应 用 平台 的 Web 部 分 的 内 容 ， 并 给 出 多 个 Web 数据 库 访 问 的 
代码 示例 。 具 体 包括 容器 管理 持久 性 (CMP), Java 数据 对 象 (JDO), Java 持久 性 API (JPA). 
JDBC. SQLJ, ActiveX 数据 对 象 (ADO)、ADO.NET 和 Oracle PL/SQL Pages (PSP). 

(11) 介绍 了 半 结 构 化 数据 及 其 与 XML 的 关系 ， 扩 展 了 XML 的 内 容 和 相关 术语 ， 包 括 
XML Schema, XQuery, XQuery 数据 模型 和 形式 语义 。 还 讨论 了 在 数据 库 中 集成 XML， 以 
及 为 发 布 XML 而 在 SQL:2008 和 SQL:2011 中 所 做 的 扩展 。 

(12) 全 面 介 绍 了 数据 仓库 、 联 机 分 析 处 理 (OLAP) 和 数据 挖掘 。 

(13) 全 面 介 绍 了 用 于 数据 仓库 数据 库 设计 的 维度 建 模 技 术 ， 并 且 通 过 一 个 完整 的 案例 
来 演示 如 何 使 用 该 方法 进行 数据 仓库 数据 库 设计 。 

(14) 介绍 了 DBMS 系统 实现 的 有 关 概 念 ， 包 括 并 发 技术 和 恢复 控制 、 安 全 以 及 查询 处 
理 和 查询 优化 。 
教学 方法 

在 开始 撰写 本 书 之 前 ， 我 们 的 目标 之 一 就 是 写 一 本 让 读者 容易 接受 和 理解 的 教材 ， 而 不 
管 读 者 具备 怎样 的 背景 知识 和 经 验 。 根 据 我 们 使 用 教材 的 经 验 以 及 从 很 多 同事 、 客 户 和 学 生 
中 吸收 的 意见 ， 实 际 上 存在 若干 读者 喜爱 和 不 喜爱 的 设计 特性 。 考 虑 到 这 些 因素 ， 本 书 决定 
采用 如 下 的 风格 和 结构 :. 

© 在 每 章 的 开头 明确 说 明 该 章 的 学 习 目 标 。 

e 清楚 定义 每 一 个 重要 的 概念 ， 并 用 特殊 格式 突出 显示 。 

e 通 篇 大 量 使 用 图 表 来 支持 和 阐明 概念 。 

。 面向 实际 应 用 : 为 了 做 到 这 点 ， 每 章 都 包含 了 许多 实际 有 效 的 示例 以 说 明 所 描述 的 

e 每 章 最 后 配 有 小 结 ， 涉 及 该 章 所 有 主要 的 概念 。 

。 每 章 最 后 配 有 思考 题 ， 问 题 的 答案 都 可 以 在 书 中 找到 。 

每 音 最 后 配 有 习题 ， 教 师 可 用 其 测试 学 生 对 章节 内 容 的 理解 ， 自 学 者 也 可 进行 自 测 。 
全 部 习题 的 答案 可 以 在 原 书 配套 的 教 辅 资源 “教师 答案 手册 ”中 找到 。 


Vill 


教 辅 资 源 9 

适用 于 本 教材 的 教 辅 资源 包括 : 

e 课程 PPT. 

e 教师 答案 手册 ， 包 括 所 有 课 后 思考 题 和 习题 的 答案 示例 。 

e 其 他 资源 的 配套 网 站 : www.pearsonhighered.com/connolly-begg。 

上 述 资源 仅 提供 给 在 www.pearsonhighered.com/ire 上 注册 过 的 教师 。 请 与 当地 的 销售 代 
表 联 系 。 


本 书 结构 


第 一 部 分 背景 


本 书 的 第 一 部 分 介绍 数据 库 系统 和 数据 库 设计 。 

第 1 章 引 入 数据 库 管 理 的 概念 。 主 要 阐述 了 数据 库 前 身 ， 即 基于 文件 的 系统 之 不 足 及 数 
据 库 方法 所 具备 的 优势 。 

第 2 章 总 览 数据 库 环境 。 主 要 讨论 了 三 层 ANSI-SPARC 体系 结构 的 优点 ， 介 绍 了 目前 
最 通用 的 数据 模型 ， 列 出 了 多 用 户 DBMS 应 提供 的 各 种 功能 。 

第 3 章 考 察 各 种 多 用 户 DBMS 结构 ， 讨 论 了 数据 库 领域 不 同类 型 的 中 间 件 。 分 析 Web 
服务 ， 它 能 为 用 户 和 SOA (面向 服务 的 结构 ) 提供 新 型 的 业务 服务 。 该 章 简 要 描述 分 布 式 
DBMS 和 数据 仓库 的 结构 ， 后 面 还 将 详细 讨论 。 该 章 还 给 出 一 个 抽象 DBMS 的 内 部 结构 以 
及 Oracle DBMS 的 逻辑 结构 和 物理 结构 ， 这 一 部 分 内 容 在 数据 库 管理 初级 课程 中 可 以 略 去 。 


第 二 部 分 ”关系 模型 与 语言 


本 书 的 第 二 部 分 介绍 关系 模型 和 关系 语言 ， 即 关系 代数 和 关系 演算 、QBE (举例 查询 ) 
和 SQL (结构 化 查询 语言 )。 这 部 分 还 介绍 了 两 种 非常 流行 的 商用 系统 : Microsoft Access 和 
Oracle, 

第 4 章 介 绍 当 前 最 流行 的 数据 模型 一 一 关系 模型 背后 的 概念 ， 这 是 最 常 被 选 作 商 用 标准 
的 模型 。 具 体 安排 是 首先 介绍 术语 并 说 明 其 与 数学 上 的 关系 的 联系 ， 然 后 讨论 关系 完整 性 规 
则 ， 包 括 实体 完整 性 和 引用 完整 性 。 这 一 章 最 后 概述 视图 ， 第 7 章 还 将 进一步 讨论 视图 。 

第 5 章 介绍 关系 代数 和 关系 演算 ， 并 用 示例 加 以 说 明 。 这 部 分 内 容 在 数据 库 管理 初级 课 
程 中 可 以 略 去 。 然 而 ， 在 第 23 章 学 习 查 询 处 理 和 第 24 章 学 习 分 布 式 DBMS 的 分 段 时 需要 
用 到 关系 代数 的 知识 。 此 外 ， 虽 然 不 是 绝对 有 必要 ， 但 是 了 解 过 程式 的 代数 与 非 过 程式 的 演 
算 之 间 的 区 别 将 有 利于 学 习 第 6 章 和 第 7 章 介绍 的 SQL 语言 。 

第 6 章 介绍 SQL 的 数据 操作 语句 SELECT, INSERT, UPDATE 和 DELETE。 该 章 通过 
一 系列 有 效 的 示例 ， 以 教程 式 的 风格 说 明了 这 些 语句 的 主要 概念 。 

第 7 章 讨论 SQL 标准 中 主要 的 数据 定义 机 制 。 该 章 仍 采用 教程 式 风 格 ， 介 绍 SQL 的 数 
据 类 型 、 数 据 定义 语句 、 完 整 性 增强 特性 (IEF) 和 数据 定义 语句 中 一 些 更 高 级 的 特性 ， 包 


O ”关于 本 书 教 辅 资 源 ， 用 书 教师 可 向 培 生 教育 出 版 集团 北京 代表 处 申请 ， 电 话 : 010-5735 5169/5735 5171， 电 
子 邮件 : service.cn@pearson.com, 一 一 编辑 注 

O 中 文 版 分 为 两 册 ， 分 别 对 应 原 书 第 一 一 五 部 分 (基础 篇 ) 和 第 六 一 九 部 分 ( 进 阶 篇 )。 本 书 为 基础 篇 。 一 一 
编辑 注 


括 访 问 控制 语句 GRANT 和 REVOKE。 此 外 ， 将 再 次 讨论 视图 以 及 用 SOL 如 何 创建 视图 。 
第 8 章 涉及 SQL 的 一 些 高 级 特性 ， 包 括 SQL 的 编程 语言 (SQL/PSM)、 触 发 器 和 存储 
过 程 。 
第 9 章 介绍 对 象 关系 DBMS， 并 详细 描述 了 SQL 新 标准 SQL:2011 中 的 各 种 对 象 管理 
特性 。 该 章 还 讨论 了 如 何 扩 展 查询 处 理 和 查询 优化 机 制 ， 以 高 效 处 理 扩展 的 各 种 数据 类 型 。 
该 章 最 后 将 讨论 Oracle 中 的 对 象 关 系 特 性 。 


第 三 部 分 ”数据 库 分 析 与 设计 


本 书 的 第 三 部 分 讨论 数据 库 分 析 和 设计 的 主要 技术 ， 以 及 这 些 技术 的 实际 运用 方法 。 

第 10 章 总 览 数据 库 系 统 开发 生命 周期 的 各 个 主要 阶段 。 特 别 强 调 了 数据 库 设 计 的 重要 
性 ， 并 说 明 这 个 过 程 如 何 被 分 为 概念 、 逻 辑 和 物理 数据 库 设计 三 个 阶段 。 此 外 ， 还 描述 了 应 用 
程序 的 设计 (功能 方面 ) 对 数据 库 设 计 (数据 方面 ) 的 影响 。 数 据 库 系统 开发 生命 周期 的 关键 
阶段 是 选择 合适 的 DBMS。 这 一 章 讨论 了 对 DBMS 的 选择 过 程 ， 提 供 了 一 系列 方针 和 建议 。 

第 11 章 讨论 数据 库 开发 者 应 于 何 时 使 用 实况 发 现 技术 ， 以 及 捕获 何 种 类 型 的 实况 。 这 
一 草 描述 了 最 常用 的 实况 发 现 技术 及 其 优 缺 点 。 通 过 DreamHome 案例 研究 说 明 在 数据 库 系 
统 生命 周期 的 早期 阶段 如 何 应 用 这 些 技术 。 

第 12 章 和 第 13 章 介 绍 了 实体 -= 联系 模型 和 扩展 的 实体 -联系 (EER) 模型 ， 在 EER 
模型 中 ， 人 允许 使 用 更 高 级 的 数据 建 模 技术 ， 如 子 类 、 超 类 和 分 类 。EER 模型 是 一 种 流行 的 高 
级 概念 数据 模型 ， 也 是 这 里 讨论 的 数据 库 设 计 方法 学 的 一 种 基本 技术 。 这 两 章 还 为 读者 介绍 
了 如 何 使 用 UML 来 表示 ER 图 。 

第 14 章 和 第 15 章 阐 述 了 规范 化 背后 的 一 系列 概念 ， 它 是 逻辑 数据 库 设 计 方 法 学 中 的 
为 一 项 重要 技术 。 通 过 从 一 个 完整 的 案例 中 抽取 的 几 个 有 效 部 分 ， 说明 如 何 从 一 种 范式 转换 
到 男 一 种 范式 ， 以 及 将 数据 库 逻 辑 设计 转换 为 某 一 更 高 范式 (直至 第 五 范式 ) 的 好 处 。 


第 四 部 分 方法 学 


本 书 的 第 四 部 分 介绍 了 一 种 数据 库 设 计 方法 学 。 该 方法 学 分 为 三 个 阶段 ， 分 别 是 概念 数 
据 库 设 计 、 逮 辑 数据 库 设计 和 物理 数据 库 设 计 。 每 个 部 分 都 使 用 DreamHome 案例 研究 加 以 
PAIR 

第 16 章 为 概念 数据 库 设 计 提 供 逐 步 指导 的 方法 学 。 该 章 说 明了 如 何 将 设计 分 解 成 多 个 
基于 各 自视 图 的 易于 管理 的 部 分 ， 还 给 出 了 标识 实体 、 属 性 、 联 系 和 关键 字 的 方法 。 

第 17 章 为 关系 模型 的 逻辑 数据 库 设计 提供 逐步 指导 的 方法 学 。 该 章 阐述 了 如 何 将 概念 
数据 模型 映射 到 人 逻辑 数据 模型 ， 以 及 如 何 针对 所 需 的 事务 使 用 规范 化 技术 来 验证 逻辑 数据 模 
型 。 对 于 有 多 个 用 户 视图 的 数据 库 系 统 ， 这 一 章 还 介绍 了 如 何 将 得 到 的 多 个 数据 模型 合并 为 
一 个 能 表示 所 有 视图 的 全 局 数据 模型 。 

第 18 章 和 第 19 章 为 关系 系统 的 物理 数据 库 设计 提供 逐步 指导 的 方法 学 。 该 章 曾 述 了 如 
何 将 逻辑 数据 库 设计 阶段 开发 的 全 局 数据 模型 转换 成 某 关 系 系统 的 物理 设计 。 方 法 学 中 还 说 
明了 如 何 通过 选择 文件 组 织 方式 和 存储 结构 ， 以 及 何 时 引入 可 控 元 余 来 改善 实现 的 性 能 。 


第 五 部 分 可 选 的 数据 库 专 题 


第 五 部 分 阐述 了 我 们 认为 对 于 现代 数据 库 管 理 课程 必要 的 四 个 专题 。 
第 20 章 讨 论 数据 库 的 安全 和 管理 问题 。 安 全 不 仅 要 考虑 DBMS ， 还 包括 整个 环境 。 该 


章 将 讨论 Microsoft Office Access 和 Oracle 提供 的 一 些 安 全 保障 ， 并 专门 阐述 了 在 Web H 
境 下 的 一 些 安全 问题 ， 并 给 出 了 解决 这 些 问题 的 方法 。 最 后 讨论 数据 管理 和 数据 库 管 理 的 
任务 。 

第 21 章 考虑 有 关 IT 和 数据 管理 与 治理 的 职业 、 法 律 与 道德 问题 。 主 要 内 容 包括 区 分 数 
据 和 数据 库 管理 员 面 对 的 问题 和 场景 中 哪些 属 法 律 范畴 、 哪 些 属 道德 范畴 ; 各 项 新 的 规章 给 
数据 和 数据 库 管 理 员 提出 了 哪些 新 的 要 求 和 职责 ; 萨 班 斯 - 奥克斯 利 法 案 和 巴塞 尔 开 协议 等 
法 规 对 数据 和 数据 库 管 理 功能 有 何 影响 ， 等 等 。 

第 22 章 集中 讨论 了 数据 库 管 理 系统 应 该 提供 的 三 种 功能 ， 即 事务 管理 、 并 发 控制 及 改 
障 恢复 。 这 些 技术 用 于 确保 当 多 个 用 户 访问 数据 库 或 出 现 硬 件 / 软件 部 件 错误 时 数据 库 是 可 第 
日 一 致 的 。 该 音 还 讨论 了 一 些 更 适合 于 长 寿 事务 的 高 级 事务 模型 ， 最 后 分 析 了 Oracle 中 的 事 
务 管理 。 

第 23 章 阐述 查询 处 理 和 查询 优化 。 该 章 讨论 查 询 优化 的 两 种 主要 技术 : 一 种 是 使 用 局 
发 式 规则 安排 查询 中 操作 的 顺序 ， 另 一 种 是 通过 比较 不 同 策略 的 相对 代价 选择 资源 耗费 最 少 
的 策略 。 最 后 分 析 了 Oracle 中 的 查询 处 理 。 


第 六 部 分 “分 布 式 DBMS 与 复制 


第 六 部 分 阐述 分 布 式 DBMS。 分 布 式 DBMS 技术 是 当前 数据 库 系统 领域 一 个 主要 的 发 
展 方向 。 本 书 前 面 各 章 主 要 介绍 集中 数据 库 系统 ， 即 由 单个 DBMS 控制 的 位 于 单个 节点 的 
单一 逻辑 数据 库 。 

第 24 章 讨论 分 布 式 DBMS 的 概念 与 问题 。 使 用 分 布 式 DBMS 时 ， 用 户 既 可 以 访问 A 
己 节点 上 的 数据 库 ， 也 可 以 访问 存储 在 远程 节点 上 的 数据 。 

第 25 章 阐 述 与 分 布 式 DBMS 相关 的 各 个 高 级 概念 。 具 体 地 说 ,重点 阐述 与 分 布 式 事务 
管理 、 并 发 控制 、 死 锁 管理 以 及 数据 库 恢 复 相 关 的 协议 。 此 外 ， 还 讨论 了 X/Open 分 布 式 事 
务 处 理 (DTP) 协议 。 最 后 分 析 了 Oracle 中 的 数据 分 布 机 制 。 

第 26 章 讨论 利用 复制 服务 器 替代 分 布 式 DBMS 的 方案 以 及 与 移动 数据 库 相 关 的 问题 。 
该 音 也 分 析 了 Oracle 中 的 复制 机 制 。 


第 七 部 分 ”对象 DBMS 


本 书 前 面 各 章 都 在 关注 关系 模型 和 关系 系统 ， 其 原因 是 这 类 系统 在 当前 传统 业务 数据 库 
应 用 中 占据 主导 地 位 。 不 过 ， 关 系 系统 并 不 是 万 能 的 ， 在 数据 库 领 域 发 展 面向 对 象 DBMS 
就 是 试图 克服 关系 系统 的 一 些 缺 陷 。 第 27 章 和 第 28 章 就 专门 叙述 这 一 方面 的 发 展 细 市 。 

第 27 章 首 先 引 入 基于 对 象 的 DBMS ( object-based DBMS) 的 概念 ， 查看 业已 出 现 的 各 
类 新 兴 的 数据 库 应 用 ， 说 明 关系 数据 模型 因 其 种 种 弱点 而 对 这 些 新 兴 的 应 用 无 能 为 力 。 然 后 
讨论 面向 对 象 DBMS object-oriented DBMS) 的 概念 ， 从 介绍 面向 对 象 数据 模型 及 持久 性 
编程 语言 开始 。 接 下 来 ， 分 析 通常 DBMS 所 用 的 两 层 存 储 模 型 与 面向 对 象 DBMS 所 用 的 单 
层 存 储 模型 的 区 别 及 对 数据 访问 的 影响 。 此 外 ， 还 讨论 了 提供 编程 语言 持久 性 的 不 同方 法 、 
指针 混 写 的 不 同 技术 、 版 本 控制 、 模 式 进化 和 面向 对 象 DBMS 体系 结构 等 问题 。 该 章 也 简 
要 介绍 了 如 何 将 本 书 第 四 部 分 介绍 的 方法 学 推广 到 面向 对 象 DBMS 中 。 

第 28 章 介绍 面向 对 象 管理 组 (Object Data Management Group, ODMG) 推荐 的 新 的 对 
象 模型 ， 这 一 模型 已 成 为 面向 对 象 DBMS 的 事实 标准 。 该 章 还 介绍 了 一 个 商用 的 面 癌 对 象 


数据 库 一 一 ObjectStore。 


第 八 部 分 Web 与 DBMS 


本 书 的 第 八 部 分 涉及 将 DBMS 集成 到 Web 环境 的 问题 ， 以 及 半 结 构 化 数据 及 其 与 
XML 的 关系 、XML 查询 语言 和 XML 到 数据 库 的 映射 。 

第 29 章 阐 述 将 DBMS 集成 到 Web 环境 的 问题 。 首 先 简单 介绍 Internet 和 Web 技术， 
然后 说 明 Web 作为 数据 库 应 用 平台 的 适宜 性 ， 并 讨论 这 种 方法 的 优 缺 点 。 随 后 讨论 若干 
种 将 DBMS 集成 到 Web 环境 的 方法 ， 包 括 脚 本 语言 、CGI、 服 务 需 扩展 、Java、ADO 和 
ADO.NET, 以 及 Oracle Internet Platform. 

第 30 章 阅 述 半 结构 化 数据 ， 然 后 讨论 XML 及 XML 如 何 成 为 Web 上 数据 表示 和 交 
换 的 流行 标准 。 该 章 讨论 XML 相关 技术 ， 如 名 字 空 间 、XSL、XPath、XPointer、XLink、 
SOAP, WSDL 和 UDDI， 等 等 。 该 章 还 阐述 怎样 用 XML 模式 定义 XML 文档 的 内 容 模型 ， 
以 及 怎样 用 资源 描述 框架 (RDF) 为 元 数据 交换 提供 框架 。 此 外 ， 还 讨论 了 XML 的 查询 语 
言 ， 具 体 集中 在 由 W3C 提出 的 XQuery。 该 草 也 讨论 了 为 文 持 XML 发 布 ， 或 更 广义 地 说 为 
在 数据 库 中 映射 和 存储 XML 而 对 SQL:2011 的 扩展 。 


第 九 部 分 ”商业 智能 


本 书 的 最 后 一 部 分 考虑 与 商业 智能 有 关 的 主要 技术 ， 包 括 数据 仓库 、 联 机 分 析 处 理 
(OLAP) 和 数据 挖掘 。 

第 31 章 讨论 数据 仓库 ， 包 插 它 的 定义 、 进 化 过 程 及 潜在 优 缺 点 。 该 章 曾 述 数 据 仓 库 的 
体系 结构 、 主 要 组 成 部 分 和 相关 工具 与 技术 ,讨论 数据 集 市 及 其 开发 和 管理 的 有 关 问 题 。 此 
外 也 讨论 了 数据 仓库 中 与 时 间 数 据 管理 关联 的 概念 及 实践 。 最 后 分 析 了 Oracle 中 的 数据 仓 
库 机 制 。 

第 32 章 提供 了 设计 用 于 决策 文 持 的 数据 仓库 和 数据 集 市 数据 库 的 方法 。 该 章 描述 了 维 
度 建 模 技 术 的 基本 概念 并 将 其 与 传统 的 实体 - 联系 建 模 技 术 进 行 比较 ; 给 出 了 数据 仓库 设计 
方法 学 指南 ， 并 通过 扩展 的 DreamHome 案例 研究 说 明 如 何 实际 使 用 该 方法 学 。 该 章 最 后 说 
明 如 何 用 Oracle Warehouse Builder 设计 数据 仓库 。 

第 33 章 考 虑 联机 分 析 处 理 ( OLAP)。 首 先 讨 论 了 何谓 OLAP 以 及 OLAP 应 用 的 主要 特 
性 ， 然 后 讨论 了 多 维 数 据 的 表示 及 主要 的 OLAP 工具 ， 最 后 讨论 了 SQL 标准 针对 OLAP 的 
扩展 以 及 Oracle 对 OLAP 的 支持 。 

第 34 章 考虑 数据 挖 据 ( DM)。 首 先 讨 论 了 何谓 DM 以 及 DM 应 用 的 主要 特性 ， 然 后 
讨论 了 数据 挖掘 操作 的 主要 特性 和 相关 技术 ， 最 后 描述 了 DM 过 程 和 DM 工具 的 主要 特性 ， 
以 及 Oracle 对 DM 的 支持 。 


附录 

附录 A 给 出 DreamHome 案例 研究 的 说 明 ， 它 将 在 全 书 通 篇 使 用 。 

附录 B 给 出 另外 三 个 案例 研究 ， 供 学 生 课程 设计 时 选用 。 

附录 C 给 出 有 别 于 UML 的 另外 两 种 建 模 表示 法 ， 即 Chen 氏 表 示 方 法 和 Crow Feet 表 
示 方 法 。 

附录 D 总 结 了 第 16 ~ 19 章 讨论 的 概念 、 逻 辑 和 物理 数据 库 设 计 方 法 学 。 


XII 


附录 E 简单 介绍 用 C# 实现 的 一 个 称 为 Pyrrho 的 轻 量 级 RDBMS, ， 它 能 说 明 本 书 讨 论 的 
许多 概念 ， 还 能 下 载 使 用 。 


TER MRS 


附录 F 介绍 文件 组 织 和 存储 结构 的 相关 概念 ， 它 们 对 理解 第 18 章 讨论 的 物理 数据 库 设 
计 和 第 23 章 讨论 的 查询 处 理 是 必要 的 。 

附录 G 给 出 Codd 的 关于 关系 DBMS 的 12 条 规则 ， 它 是 鉴别 关系 DBMS 的 标准 。 

附录 H 介绍 了 两 种 最 常用 的 商用 关系 DBMS : Microsoft Office Access 和 Oracles E% 
书 的 许多 章节 中 ， 都 涵盖 这 两 种 DBMS 如 何 实现 各 种 机 制 的 内 容 ， 例 如 安全 和 查询 处 理 等 。 

附录 1 借助 C 语 言 示例 程序 说 明和 嵌入 式 和 动态 SQL， 还 介绍 了 开放 数据 库 互 连 
(ODBC)， 这 一 标准 现在 已 经 成 为 访问 异 构 SQL 数据 库 的 业界 标准 。 

附录 J 讨论 如 何 估 计 Oracle 数据 库 的 磁盘 空间 需求 。 

附录 K 概述 面向 对 象 的 主要 概念 。 

附录 上 提供 若干 Web 脚本 示例 ， 补 充 第 29 章 关 于 Web 和 DBMS 的 讨论 。 

附录 M 介绍 交互 式 查询 语言 QBE (举例 查询 )， 对 于 非 专业 用 户 来 说 ， 它 是 访问 数据 库 
时 最 易 使 用 的 语言 之 一 。 附 录 中 将 使 用 Microsoft Office Access 来 说 明 QBE 的 用 法 。 

附录 N 给 出 第 三 代 DBMS 宣言 。 

附录 O 介绍 Postgres， 它 是 一 个 早期 的 对 象 天 系 DBMS. 

本 书 的 逻辑 组 织 及 建议 的 阅读 路 线 见 图 0-1。 
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数据 库 简 介 








本 章 目标 
本 章 我 们 主要 学 习 : 

数据 库 系 统 的 重要 性 

某 些 常见 的 数据 库 系统 应 用 实例 

基于 文件 的 系统 的 特性 

基于 文件 的 系统 所 面临 的 问题 

术语 “数据 库 ” 的 含义 

术语 “数据 库 管 理 系 统 ”(DBMS ) 的 含义 
DBMS 的 典型 功能 

DBMS 环境 的 主要 组 成 部 分 

5 DBMS 环境 有 关 的 各 类 人 员 
DBMS 的 发 展 历史 

DBMS 的 优 缺 点 


不 过 区 区 50 年 ， 数 据 库 的 研究 对 国民 经 济 和 人 类 社会 产生 了 巨大 的 影响 ， 诞 生 了 一 个 
年 产值 在 350 亿 至 500 亿美 金 的 产业 。 数 据 库 系 统 ， 也 就 是 本 书 的 主题 ， 坚 无 疑问 是 软件 
工程 领域 最 引 人 注 目的 成 就 ， 并 且 数 据 库 目前 作为 所 有 信息 系统 的 基础 ， 正 改变 着 许多 组 织 
机 构 的 运作 方式 。 随 着 硬件 功能 、 硬 件 容量 的 显著 提高 以 及 通信 技术 的 快速 发 展 ， 包 括 万 维 
网 、 电 子 贸 易 、 商 务 智能 、 移 动 通信 和 网 格 计算 等 技术 的 出 现 ， 数 据 库 系 统 的 重要 性 已 经 越 
来 越 突显 。 

数据 库 技 术 本 身 已 经 成 为 一 个 令 人 振奋 的 研究 领域 ， 同 时 催化 了 软件 工程 领域 许多 其 他 
方向 的 发 展 。 数 据 库 的 研究 远 没 有 终止 ， 还 有 许多 问题 尚 待 探讨。 实际 上 ， 随 着 数据 库 系统 
应 用 越 来 越 复式 ， 人 们 必须 重新 考虑 现在 正在 使 用 的 许多 算法 ， 例 如 文件 存储 、 访 问 和 查询 
优化 的 算法 。 原 来 的 这 些 算法 对 软件 工程 的 发 展 曾 做 出 了 重要 页 献 ， 毫 无 疑问 ,不 断 出 现 的 
新 算法 也 将 显现 同样 的 影响 。 本 章 将 首先 介绍 数据 库 系 统 。 

由 于 其 重要 性 ， 者 于 有 关 计 算 和 商务 的 课程 都 包括 数据 库 系统 的 内 容 。 本 书 主要 讨论 与 
数据 库 系统 实现 和 应 用 相关 的 问题 。 我 们 也 将 集中 学 习 如 何 设计 一 个 数据 库 ， 并 给 出 一 套 方 
法 学 以 指导 大 家 设计 或 简 或 材 的 数据 库 。 


| 本 章 结构 

1.1 节 引 入 了 一 些 日 常生 活 中 常用 但 却 未 引起 特别 注意 的 数据 库 系 统 应 用 实例 。1.2 节 
和 1.3 节 中 ， 将 早期 用 于 手工 文件 计算 机 化 的 基于 文件 的 方法 与 现代 更 实用 的 数据 库 方法 进 
行 比较 。1.4 节 讨 论 了 在 数据 库 环境 中 人 可 能 担 任 的 四 种 角色 ， 分 别 是 数据 和 数据 库 管 理 员 、 
数据 库 设 计 人 员 、 应 用 开发 人 员 和 终端 用 户 。1.5 节 简 单 回顾 了 数据 库 的 发 展 史 ，1.6 节 讨 论 
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数据 库 系 统 的 优 缺 点 。 

贯穿 全 书 ， 我 们 使 用 一 个 称 为 DreamHome 的 系统 作为 例子 来 介绍 所 有 的 概念 ， 它 基于 
一 个 虚拟 的 房产 管理 公司 。11.4 节 和 附录 A 对 这 个 例子 进行 了 详细 的 叙述 。 附 录 B 提供 了 
另外 一 些 更 加 实际 的 案例 ， 许 多 章 后 习题 将 用 到 这 些 案例 。 


1.1 引言 


数据 库 系统 其 实现 在 已 是 人 们 生活 中 密 不 可 分 的 一 部 分 ， 只 是 并 非 每 个 人 使 用 时 都 有 所 
察觉 。 作 为 对 数据 库 讨 论 的 开始 ， 本 章 首先 查看 数据 库 系 统 的 一 些 常 见 应 用 。 为 此 ， 暂 时 将 
数据 库 看 作 一 组 相关 的 数据 ， 将 数据 库 管理 系统 (DBMS ) 看 作 管理 和 控制 这 组 数据 的 软件 。 
而 数据 库 应 用 就 是 一 个 程序 ， 它 在 运行 过 程 的 某 些 点 上 与 数据 库 相互 作用 。 此 外 ,我 们 使 用 
术语 数据 库 系 统 来 指 代 包 括 与 数据 库 相 互 作用 的 一 组 应 用 程序 、DBMS 和 数据 库 在 内 的 所 有 
东西 。1.3 节 将 对 上 述 各 个 术语 给 出 更 加 准确 的 定义 。 
超市 购物 

当 我 们 在 超市 购买 商品 时 ， 甚 实 就 是 在 访问 一 个 数据 库 。 收 银 员 使 用 条 形 码 阅读 器 扫描 
客户 购买 的 每 一 件 商品 。 这 个 条 形 码 阅读 器 连接 着 一 个 访问 商品 数据 库 的 应 用 程序 ， 该 程序 
根据 条 形 码 从 商品 数据 库 中 找 出 商品 价格 ， 从 库存 中 减 去 本 次 销售 这 种 商品 的 数量 ， 并 且 在 
屏幕 上 显示 价钱 。 如 果 存 货 量 低 于 预定 的 冰 值 ， 数 据 库 系 统 将 提示 进货 以 补充 存货 。 如 果 有 
客户 向 超市 打 电 话 订购 商品 ， 售 货 员 可 以 通过 运行 应 用 程序 ， 从 数据 库 中 检查 某 商 品 是 否 有 
足够 的 存货 。 
信用 卡 消费 

当 使 用 信用 卡 购 买 商品 时 ， 售 货 员 一 般 要 检查 客户 是 否 有 足够 的 信用 额度 。 该 项 检查 可 
以 通过 打 电 话 进行 ， 也 可 以 通过 一 个 与 计算 机 系统 相连 接 的 信用 卡 阅读 器 自动 进行 。 无 论 哪 
种 方式 ， 一 定 在 某 处 存 有 该 客户 使 用 信用 卡 购买 过 商品 的 所 有 信息 。 为 了 检查 客户 的 信用 人 情 
况 ， 需 要 有 一 个 数据 库 应 用 程序 ， 使 用 信用 卡号 码 检索 这 个 月 客户 已 购买 商品 的 总 价格 ， 加 
上 这 次 希望 用 信用 卡 购买 的 商品 的 价格 ， 判 断 是 否 仍 在 信用 额度 之 内 。 如 果 这 次 购买 被 确 
认 ， 则 购买 的 详细 内 容 将 被 记录 到 该 数据 库 中 。 应 用 程序 还 要 访问 数据 库 ， 在 同意 购买 之 
前 ， 检 查 信 用 卡 不 属 被 盗 或 者 丢失 之 列 。 此 外 ， 一 般 还 有 一 些 其 他 的 应 用 程序 负责 每 月 向 信 
用 卡 持 卡 人 发 送信 用 卡 使 用 记录 ， 并 在 收 到 付款 之 后 向 信用 卡 持 卡 人 发 送信 息 。 
通过 旅行 社 预订 假期 行程 

当 旅 客 向 旅行 社 咨询 假期 行程 安排 时 ， 旅 行 社 将 访问 多 个 包含 假日 和 航班 详细 信息 的 数 
据 库 。 若 客户 预订 旅程 ， 数 据 库 系统 必须 进行 所 有 必要 的 预订 安排 。 在 这 种 情况 下 ， 系 统 必 
须 确保 一 个 座位 不 被 两 个 不 同 的 旅行 社 预订 ， 以 及 航班 的 预订 座位 不 超过 航班 的 固定 座位 。 
例如 ， 假 设 从 伦敦 飞 往 纽 约 的 航班 上 仅 剩 最 后 一 个 座位 ， 却 有 两 个 旅行 社 同时 要 求 预订 该 座 
位 ， 系 统 必 须 能 够 分 辩 和 处 理 这 种 情况 ， 即 允许 一 个 预订 继续 进行 ， 通 知 另外 一 个 旅行 社 已 
经 没有 剩余 的 座位 。 旅 行 社 通常 可 能 还 有 另外 一 个 数据 库 用 于 开 列 票据 。 

使 用 当地 图 书馆 

在 图 书馆 中 可 能 存在 一 个 数据 库 ， 储 存 着 图 书馆 中 所 有 图 书 的 详细 资料 、 读 者 的 详细 信 
息 以 及 图 书 预 订 信 息 等 。 可 能 还 有 一 个 计算 机 索引 系统 ， 供 读者 个 人 根据 书 名 、 作 者 或 者 摘 
要 等 信息 查找 书籍 。 数 据 库 系统 还 能 提供 预订 服务 ， 即 允许 读者 预订 图 书 ， 当 该 书 可 以 借阅 
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时 ， 用 邮件 的 方式 通知 读者 。 系 统 还 向 借 书 的 读者 发 送 提醒 信息 ， 告 知 其 在 规定 的 期 限 内 尚 
未 归还 所 借 书 。 典 型 的 情况 是 ， 系 统 还 配 有 一 个 条 形 码 阅读 嚣 ， 与 前 述 超市 的 场景 相似 ， 用 
来 扫描 并 记录 下 进出 图 书馆 的 所 有 书籍 。 

投保 


无 论 何 时 在 想 投保 某 个 险种 ， 比 如 寿险 、 家 庭 财产 险 或 汽车 保险 ， 保 险 经 纪 人 都 可 能 要 
访问 多 个 保险 机 构 的 数据 库 。 数 据 库 系统 根据 所 提供 的 客户 个 人 详细 信息 ， 如 姓名 、 家 庭 住 
址 、 年 龄 等 情况 ， 来 确定 保险 的 金额 。 保 险 经 纪 人 可 通过 查阅 多 个 数据 库 ， 找 到 一 个 能 给 客 
户 最 大 实惠 的 保险 组 织 。 
租借 DVD 

当 你 从 某 个 DVD 公司 租 矶 时 大 都 看 到 一 个 数据 库 ， 其 中 记录 着 每 张 DVD 的 名 称 和 找 
贝 数 以 及 每 个 拷贝 是 已 借 出 还 是 在 店 里 ， 还 记录 着 每 个 会 员 (租借 人 ) 的 详细 信息 ， 包 括 他 
目前 借 了 那些 DVD 及 应 归还 日 期 。 数 据 库 中 也 可 能 存储 着 关于 每 张 DVD 的 更 多 信息 ， 比 
如 影片 的 导演 和 演员 。 公 司 可 以 利用 这 些 信息 监控 库存 的 利用 率 ， 或 根据 历史 租借 数据 预测 
未 来 趋势 。 

使 用 Internet 


Internet 中 的 许多 网 站 都 是 通过 数据 库 应 用 驱动 的 。 例 如 ， 可 以 访问 一 个 在 线 书 店 ， 浏 
览 和 购买 书籍 ， 比 如 Amazon.com。 书 店 允 许 客户 在 不 同 的 种 类 中 浏览 书籍 ， 例 如 计算 机 类 
或 者 管理 类 ,或 者 按 作者 的 姓名 来 浏览 书籍 。 无 论 何 种 情形 ， 该 组 织 的 网 络 服 务 器 中 都 存在 
一 个 数据 库 ， 含有 所 有 书籍 的 详细 信息 ， 以 及 是 否 有 存货 、 运 送 情况 、 库 存量 和 正在 订购 等 
信息 。 书 籍 详细 信息 包括 书 名 、ISBN、 人 作者、 价格 、 销 售 记 录 、 出 版 社 、 简 介 和 详细 描述 
等 。 在 数据 库 中 书籍 可 被 交叉 引用 。 例 如 ， 一 本 书 可 能 被 列 在 多 个 种 类 下 ， 比 如 同时 列 在 计 
算 机 、 程 序 语 言 、 畅 销 书 和 推荐 书籍 名 下 。 交 叉 引 用 使 得 Amazon 网 站 能 为 客户 提供 与 其 感 
兴趣 的 主题 相关 的 其 他 书籍 的 信息 。 

像 前 面 的 例子 一 样 ， 可 以 通过 提供 自己 信用 卡 的 详细 信息 ， 在 线 购买 一 本 或 多 本 书籍 。 
Amazon 网 站 将 通过 保存 所 有 先前 交易 的 记录 ， 包 括 购 买 的 书目 、 送 货 地 点 和 信用 卡 详细 信 
息 ， 为 重 返 网 站 的 用 户 提 供 个 性 化 服务 。 当 用 户 重 返 该 网 站 时 ， 将 会 看 到 自己 的 名 字 出 现在 
欢迎 语 中 ， 并 且 可 以 看 到 基于 客户 交易 历史 推荐 的 一 组 主题 书籍 列表 。 

大 学 学 习 

如 果 你 正在 大 学 就 读 ， 学 校 可 能 有 一 个 包含 学 生 所 有 信息 的 数据 库 系统 ,包括 所 注册 的 
课程 、 兽 获得 的 各 类 奖学金 、 往 年 已 选择 的 课程 和 今年 正在 选择 的 课程 以 及 所 有 考试 成 绩 。 
可 能 还 有 一 个 数据 库 包 含 在 大 学 中 工作 的 员工 的 详细 信息 ， 为 工资 发 放 部 门 提 供与 工资 相关 
的 详细 个 人 信息 。 

上 述 是 常见 数据 库 系统 中 的 几 个 ， 你 肯定 还 会 遇见 其 他 更 多 的 数据 库 系统 。 虽 然 我 们 
今天 对 这 样 一 些 应 用 司空 见 惯 ,但 其 实数 据 库 系统 是 相当 复杂 的 技术 ， 历 经 了 四 十 多 年 的 发 
展 。 下 一 节 我 们 先 回顾 一 下 数据 库 系统 的 前 映 : 基于 文件 的 系统 。 


1.2 ”传统 的 基于 文件 的 系统 


内 容 全 面 一 些 的 数据 库 书籍 在 介绍 数据 库 系 统 之 前 ,一定 会 对 它 的 前 驱 ( 基 于 文件 的 系 
统 ) 进行 简单 的 回顾 ， 这 几乎 已 成 为 惯例 。 本 书 也 不 例外 。 尽 管 基于 文件 的 方法 已 基本 不 用 
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了 ,但 是 研究 它 还 是 有 道理 的 : 
© 搞 清 基于 文件 的 系统 固有 的 问题 ， 可 以 避免 在 数据 库 系统 中 重复 这 些 问 题 。 换 句 话 
说 ， 应 该 向 以 前 所 犯 的 错误 学 习 。 实 际 上 ， 使 用 “错误 ”这 个 词 多 少 有 些 贬 义 ， 未 
能 对 多 年 来 文件 系统 所 提供 的 有 用 服务 给 予 足够 的 认可 。 然 而 ， 人 们 已 经 从 中 学 会 
了 用 更 好 的 方法 处 理 数 据 。 
© 后 想 将 一 个 基于 文件 的 系统 转换 成 一 个 数据 库 系 统 ， 尽 管 不 是 必要 的 ,但 了 解 文件 
系统 如 何 工 作 将 会 很 有 帮助 。 


1.2.1 基于 文件 的 方法 


基于 文件 的 系统 | 为 终端 用 户 提 供 服务 的 一 组 应 用 程序 ， 如 生成 报表 等 。 每 一 个 程序 定义 
和 管理 它 自己 的 数据 。 


基于 文件 的 系统 是 将 人 们 熟悉 的 手工 文件 计算 机 化 的 一 种 早期 的 方法 。 例 如 ， 某 个 单位 
可 能 手工 创建 一 个 纸 质 文件 ， 用 以 记录 有 关 项 目 、 商 品 、 任 务 、 客 户 和 雇员 的 所 有 内 部 和 外 
部 对 应 关系 。 更 典型 的 情况 是 可 能 存在 多 个 这 样 的 文件 ， 分 别 被 贴 上 标签 ， 保 存在 一 个 或 多 
个 文件 柜 中 。 为 了 安全 起 见 ， 这 些 文件 柜 还 可 能 被 锁 起 来 ， 或 者 放 在 安全 的 地 方 。 在 我 们 自 
己 家 中 ， 也 可 能 有 一 些 文件 ， 分 别 保存 收据 、 保 单 、 发 票 、 银 行 结算 单 等 东西 。 当 需要 查找 
某 项 内 容 时 ， 一 般 需 从 所 保存 文件 的 第 一 项 开始 逐 项 遍历 ， 直 到 发 现 需 要 的 东西 。 当 然 , 我 
们 也 可 借助 索引 系统 更 快 地 进行 定位 。 比 如 我 们 可 根据 逻辑 相关 性 将 保存 的 项 目 先 分 门 别 类 
地 组 织 在 各 种 文件 夹 中 。 

当 存 储 的 项 目 数量 较 少 时 ， 手工 的 文件 系统 尚 可 以 很 好 地 发 挥 作用 。 即 使 项 目 量 较 大 ， 
若 只 需要 存储 和 检索 它们 ， 手 工 的 文件 系统 仍然 可 以 很 好 地 工作 。 然 而 ， 出 现 交 叉 引 用 或 者 
需 在 文件 中 更 改 信 息 时 ， 手 工 的 文件 系统 就 难以 为 继 。 例 如 ， 一 个 典型 的 房产 代理 机 构 可 能 
对 每 一 个 待 售 或 待 租 的 房产 、 每 一 个 可 能 的 购买 者 和 租用 者 ， 以 及 每 一 个 员工 都 有 一 个 分 开 
的 数据 文件 。 设 想 一 下 如 果 要 回答 下 面 的 问题 需要 付出 多 少 工 作 量 : 

有 和 多少 带 花 园 和 车 库 的 三 居室 房产 出 售 ? 

在 距离 市 中 心 3 千 米 以 内 的 地 方 ， 有 多 少 房间 可 以 出 租 ? 
两 居室 房间 平均 的 租金 是 多 少 ? 

员工 的 年 薪 总 和 是 多 少 ? 

© 上 一 个 月 的 交易 量 与 这 个 月 计划 的 交易 量 相 比 如 何 ? 

e 在 下 一 个 财政 年 度 中 预计 的 交易 量 是 多 少 ? 

如 今 客 户 、 高 级 管理 人 员 和 员工 需要 越 来 越 多 的 信息 。 在 某 些 部 门 ， 按 月 、 季 度 和 年 生 
成 报表 都 是 合理 的 需求 。 很 明显 ， 手 工 文件 系统 对 于 这 类 工作 已 很 不 适宜 。 基 于 文件 的 系统 
正 是 为 了 满足 工业 上 能 进行 更 高 效 的 数据 访问 的 需要 而 应 运 而 生 的 。 然 而 ， 它 仍 未 能 集中 存 
储 组 织 机 构 的 运行 数据 ， 而 是 采用 了 分 散 的 方法 ， 即 每 一 个 部 门 在 数据 处 理 CDP) 人 员 的 帮 
助 下 ， 存 储 和 控制 他 们 各 自 的 数据 。 为 了 理解 其 含义 ， 让 我 们 来 看 一 下 DreamHome 实例 。 

销售 部 门 负 责 房产 的 出 售 和 出 租 业 务 。 例 如 ， 当 一 个 客户 与 销售 部 门 联系 ， 想 要 在 市 场 
上 出 租 他 的 房产 ， 则 首先 会 填写 一 个 类 似 于 图 1-1a 的 表格 。 该 表格 给 出 了 关于 房产 的 详细 
信息 ， 例 如 地 址 、 房 间 数 量 及 业主 的 详细 信息 。 销 售 部 门 还 负责 答复 来 自 客 户 的 查询 ， 并 且 
为 每 一 个 客户 填写 类 似 于 图 1-1b 的 表格 。 在 数据 处 理 部 门 的 帮助 下 ， 销 售 部 门 创建 一 个 信 
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县 系统 来 处 理 房产 的 出 租 业 务 。 这 个 系统 包括 三 个 文件 ， 分 别 包含 房产 、 业 主 和 客户 的 详细 
信息 ， 如 图 1-2 所 示 。 为 了 简化 起 见 ， 不 考虑 员工 、 分 公司 和 业主 之 间 的 关联 信息 。 


DreamHome 
Client Details 
Client Number: CR74 


DreamHome 
Property for Rent Details 
Property Number: PG21 


Address 18 Dale Rd Allocated to Branch: 
163 Main St, Glasgow 


First Name Mike Last Name Ritchie 


City Glasgow Address 18 lain St Tel.No. 01475-392178 


Branch No. B003- FAIG YQ 


Postcode G12 


Type House 


Staff Responsible 
No.of Rooms 5 Ann Beech 


Preferred Property Type House Maximum Monthly Rent 750 


General Comments Currently living at home with parents 
Getting married in August 
Name Carol Farrel Business Name 
Address 6 Achray St Address 
Glasgow G32 9DX 


Seen By Ann Beech Date 24-Mar-13 


Branch No. B003 Branch City Glasgow 





Tel.No. 0141-357-7419 Tel. No. 


Owner No. C087 Owner No. b) 客户 的 详细 信息 表 


Contact Name 


Business Type 





a) 出 租房 产 的 详细 信息 表 
图 1-1 销售 部 门 表格 


PropertyForRent 


renee [ov [rome [none [ome 


16 Holhead Rd | Aberdeen | AB7 5SU 
6 Argyll St London | NW2 

6 Lawrence St | Glasgow | G11 9QX 
2 Manor Rd Glasgow | G32 4QX 
18 Dale Rd Glasgow | GI2 

5 Novar Dr Glasgow | G12 9AX 


CO46 Joe Keogh 2 Fergus Dr, Aberdeen AB2 7SX | 01224-861212 

CO87 Carol Farrel 6 Achray St, Glasgow G32 9DX | 0141-357-7419 
CO40 Tina Murphy | 63 Well St, Glasgow G42 0141-943-1728 
CO93 Tony Shaw 12 Park Pl, Glasgow G4 OQR 0141-225-7025 





Client 


56 High St, London SW1 4EH | 0207-774-5632 


Stewart | 64 Fern Dr, Glasgow G42 OBL | 0141-848-1825 
Ritchie 18 Tain St, PAIG 1YQ 01475-392178 
Tregear | 5 Tarbot Rd, Aberdeen AB9 3ST | 01224-196720 


图 1-2 ”销售 部 门 所 使 用 的 PropertyForRent, PrivateOwner 和 Client 文件 
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合同 部 门 负责 处 理 与 出 租房 产 相 关 的 出 租 协议 。 当 某 客户 同意 租用 一 处 房产 时 ， 销 售 员 
将 会 填写 一 份 表格 ， 包 括 客 户 和 房产 的 详细 信息 ， 如 图 1-3 所 示 。 这 个 表格 将 会 被 送 到 合同 
部 门 ， 由 合同 部 门 分 配 一 个 租用 编号 ， 并 且 完 成 支付 和 租用 过 程 中 的 详细 内 容 。 在 数据 处 理 
部 门 的 帮助 下 ， 合 同 部 门 创 建 一 个 信息 系统 来 处 理 租用 协议 。 这 个 系统 包含 三 个 文件 ， 分 别 
处 理 租 用 、 房 产 和 客户 的 详细 信息 ， 与 销售 部 门 所 含有 的 数据 类 似 ， 如 图 1-4 所 示 。 


DreamHome 
Lease Details 
Lease Number: 10012 


Client No. CR74 Property No. FG21 


Full Name Mike Ritchie Address 18 Dale Ra 


: 1 
Address (previous) 18 Tain St Sa Sead 
PAIG 1YQ 


Tel. No. 01475-392178 


Monthly Rent 600 Rent Start Date 1-Jul-13 
Payment Method Cheque Rent Finish Date 30-Jun-14 


Deposit 1200 Paid (Y or N) Y- Duration 1Yzar 





图 1-3 合同 部 门 使 用 的 租约 详细 信息 表 


Lease 


leaseNo | propertyNo | clientNo it | paid | rentStart | rentFinish soy 
ini 

10024 PAI4 CR62 650 | Visa 1300 1-Jun-13 | 31-May-14 | 12 

10075 PL94 CR76 400 | Cash 800 1-Aug-13 | 31-Jan-14 

10012 PG21 CR74 600 | Cheque | 1200 i-Jul-13 | 30-Jun-14 | 12 


PropertyForRent 


rr Te 
PAI4 16 Holhead | Aberdeen | AB7 5SU | 650 
PL94 6ArgyllSt | London | NW2 400 
PG21 18 Dale Rd | Glasgow | G12 

Client 


CR76 svelte Kay 56 High St, London SW1 4EH | 0171-774-5632 
CR74 Mike Ritchie | 18 Tain St, PAIG 1YQ 01475-392178 
CR62 Mary | Tregear | 5 Tarbot Rd, Aberdeen AB9 3ST | 01224-196720 


图 1-4 合同 部 门 使 用 的 Lease. PropertyForRent 和 Client 文件 


图 1-5 所 示 为 整个 过 程 。 它 显示 了 各 个 部 门 通过 为 它们 特别 编写 的 应 用 程序 来 访问 各 自 
的 文件 。 每 组 部 门 应 用 程序 处 理 自己 的 数据 录入 、 文 件 维护 和 特定 报表 的 产生 。 更 重要 的 
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是， 数据 文件 和 记录 的 物理 结构 和 存储 是 由 应 用 程序 定义 的 。 





合同 文件 


销售 文件 
PropertyForRent (propertyNo, street, city, postcode, type, rooms, rent, ownerNo) 
PrivateOwner (ownerNo, fName, IName, address, telNo) 
Client (clientNo, fName, Name, address, telNo, preffype, maxRent) 


合同 文件 
Lease (leaseNo, propertyNo, clientNo, rent, paymentMethod, deposit, paid, rentStart, rentFinish, duration) 
PropertyForRent (propertyNo, street, city, postcode, rent) 
Client (clientNo, fName, IName, address, telNo) 


图 1-5 基于 文件 的 处 理 过 程 


在 其 他 部 门 同样 可 以 发 现 类 似 的 例子 。 例 如 ， 工 资 发 放 部 门 保 存 与 每 一 个 员工 的 工资 相 
关 的 详细 信息 ， 即 : 


StaffSalary(staffNo, fName, IName, sex, salary, branchNo) 


而 人 事 部 门 也 保存 了 员工 的 详细 信息 ， 即 : 


Staff(staffNo, fName, IName, position, sex, dateOfBirth, salary, branchNo) 


可 以 很 清楚 地 看 出 ， 在 这 些 部 门 中 含有 许多 重复 的 信息 ， 基 于 文件 的 系统 普遍 存在 这 个 
问题 。 在 讨论 该 方法 的 局 限 性 之 前 ， 首 先 了 解 一 下 基于 文件 的 系统 所 使 用 的 术语 是 很 有 必要 
的 。 一 个 文件 只 是 一 些 记 录 的 简单 集合 ， 这 些 记录 中 包含 逻辑 上 相关 的 数据 。 例 如 ， 在 
图 1-2 中 表示 的 PropertyForRent 文件 包含 六 条 记录 ， 每 一 处 房产 对 应 一 条 记录 。 每 一 条 记 
录 包 含 一 组 逻辑 上 相关 的 一 个 或 多 个 数据 项 (或 域 )， 每 一 个 数据 项 代表 了 所 建 模 的 现实 世 
界 房产 的 某 种 特性 。 在 图 1-2 中 ，PropertyForRent 文件 的 数据 项 代表 了 房产 的 特性 ， 例 如 地 


址 、 房 产 类 型 及 房间 数量 等 。 表 1-1 基于 文件 系统 的 局 限 性 
数据 被 分 离 和 孤立 
12.2 ”基于 文件 方法 的 局 限 性 Aksi 
上 述 对 传统 基于 文件 的 系统 的 简介 足以 用 来 讨论 这 ”数据 存在 依赖 性 
种 方法 的 局 限 性 。 表 1-1 列 出 了 五 个 方面 的 问题 。 文件 格式 不 相 容 


当 数 据 被 孤立 在 分 离 的 文件 中 时 ,访问 这 些 数 据 变 得 更 加 困难 。 例 如 ， 如 果 想 建立 一 个 
满足 客户 要 求 的 所 有 连 体 房 的 列表 ， 那 么 首先 不 得 不 创建 一 个 临时 文件 ， 列 出 所 有 需要 连 体 
房 这 种 户型 的 客户 。 然 后 查阅 PropertyForRent 文件 ， 查 找 房产 类 型 为 连 体 房 并 且 租 金 少 于 
客户 最 高 租金 的 那些 项 目 。 对 于 文件 系统 来 说 ， 这 个 过 程 是 非常 困难 的 。 应 用 程序 开发 者 必 
须 保持 两 个 文件 访问 过 程 的 同步 性 ， 以 确保 提取 的 数据 是 正确 的 。 如 果 需 要 来 自 于 多 于 两 个 
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文件 中 的 数据 ， 难 度 还 会 增加 。 
数据 存在 元 余 

由 于 不 同 部 门 的 各 自 为 战 ， 基 于 文件 的 系统 导致 了 失控 的 数据 元 余 ， 必 需 的 元 余 除 外 。 
例如 在 图 1-5 中 ， 可 以 清楚 地 看 到 ， 在 销售 部 门 和 合同 部 门 存 在 房产 和 客户 详细 信息 的 宛 
余 。 由 于 下 述 原 因 ， 失 控 的 数据 元 余 不 受 欢迎 : 

© 元 余 是 一 种 浪费 。 它 需要 花费 更 多 的 时 间 和 资金 录入 一 次 以 上 数据 。 

e 元 余 占用 更 多 的 存储 空间 ， 同 时 增加 与 之 相关 的 费用 。 在 许多 情况 下 ， 数 据 的 元 余 
可 以 通过 共享 数据 文件 来 解决 。 
也 许 最 重要 的 是 ， 苑 余 可 能 导致 数据 完整 性 遭 到 破坏 。 换 句 话 说， 这些 数据 可 能 将 
不 再 一 致 了 。 例 如 ， 让 我 们 考虑 一 下 前 面 所 讨论 过 的 工资 发 放 部 门 和 人 事 部 门 之 间 
的 数据 元 余 。 如 果 一 个 员工 搬 了 住处 ， 只 将 地 址 的 改变 告知 人 事 部 门 ， 而 没有 通知 
工资 发 放 部 门 ， 那 么 这 个 员工 的 工资 清单 将 会 被 寄 到 错误 的 地 方 。 当 一 个 员工 升 职 ， 
工资 也 随 着 改变 时 ， 如 果 此 时 这 个 变化 只 通知 了 人 事 部 门 ， 而 没有 在 工资 发 放 部 门 
登记 ， 人 情况 将 会 变 得 更 严重 。 这 时 ， 员 工 将 会 收 到 错误 的 工资 。 当 检测 到 这 种 错误 
时 ， 想 要 解决 这 个 问题 通常 要 花费 很 大 的 努力 和 很 多 的 时 间 。 这 两 个 例子 中 介绍 的 
数据 不 一 致 性 都 是 由 于 数据 的 元 余 产 生 的 。 因 为 没有 方法 可 以 使 人 事 部 门 自 动 更 新 
工资 发 放 部 门 的 数据 ， 这 种 数据 的 不 一 致 性 是 可 以 预见 的 。 即 使 工资 发 放 部 门 知道 
了 这 个 数据 的 变化 ， 输 入 数据 时 也 可 能 出 错 。 
数据 存在 依赖 性 

前 面 已 经 提 到 过 ， 数 据 文件 的 物理 结构 和 存储 方式 是 由 应 用 程序 定义 的 。 这 就 意味 着 ， 
改变 已 经 存在 的 结构 十 分 困难 。 比 如 ， 欲 将 PropertyForRent 文件 中 的 address 数据 项 从 40 
个 字符 长 增加 为 41。 看 似 一 个 很 简单 的 变化 ， 却 需要 创建 一 个 专门 的 程序 (这 个 程序 可 能 只 
运行 一 次 ， 然 后 就 丢弃 )， 将 PropertyForRent 文件 转换 成 一 种 新 的 格式 。 这 个 程序 必须 : 

e 打开 原始 的 PropertyForRent 文件 供 读 取 。 

© 打开 一 个 具有 新 结构 的 临时 文件 。 

e 从 原始 文件 中 读 取 一 个 记录 ， 修 改 数据 ,使 之 与 新 的 格式 相符 ， 并 将 它 写 入 临时 文 

件 中 。 对 原始 文件 中 的 所 有 记录 重复 上 述 工 作 。 

e 删除 原始 的 PropertyForRent 文件 。 

e 将 临时 文件 更 名 为 PropertyForRent。 

另外 ， 所 有 访问 PropertyForRent 文件 的 应 用 程序 必须 进行 修改 ， 以 便 与 新 的 文件 结构 
相符 。 可 能 会 有 多 个 程序 访问 PropertyForRent 文件 。 程 序 员 需要 找到 所 有 受到 影响 的 程序 ， 
一 一 修改 它们 ， 然 后 重新 进行 测试 。 注 意 ， 这 其 中 有 的 程序 可 能 从 未 用 到 修改 的 address 数 
据 项 ， 而 仅仅 是 使 用 了 PropertyForRent 文件 。 很 明显 ， 这 是 一 件 很 浪费 时 间 并 且 极 易 出 错 
的 工作 。 基 于 文件 系统 的 这 个 特性 就 是 所 谓 的 程序 - 数据 依赖 性 。 
文件 格式 不 相 容 

因为 文件 的 结构 是 舱 入 到 应 用 程序 中 的 ， 因 此 这 个 结构 取决 于 应 用 程序 使 用 的 语言 。 例 
in, H COBOL 语言 编写 的 程序 所 形成 的 文件 结构 与 用 C 语言 编写 的 程序 所 形成 的 文件 结构 
是 不 同 的 。 这 种 文件 的 直接 不 相 容 性 使 它们 很 难 联合 运行 。 

例如 ， 设 想 一 下 合同 部 门 想 要 找 出 所 有 的 业主 姓名 和 地 址 。 然 而 遗憾 的 是 ， 合同 部 
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门 没有 保留 业主 的 详细 信息 ， 只 有 销售 部 门 保留 这 些 信息 。 然 而 合同 部 门 拥 有 房产 编号 
(propertyNo)， 可 以 用 这 个 编号 找到 销售 部 门 的 PropertyForRent 文件 中 相对 应 的 房产 编号 。 
这 个 文件 中 还 有 业主 编号 (ownerNo)， 可 以 再 利用 这 个 编号 找到 PrivateOwner 文件 中 业主 
的 详细 信息 。 假 设 合 同 部 门 的 程序 是 用 COBOL 语言 编写 的 ， 而 销售 部 门 的 程序 是 用 C 语言 
编写 的 。 那 么 ， 为 了 使 两 个 PropertyForRent 文件 中 的 propertyNo 相 匹 配 ， 就 要 求 应 用 开发 
人 员 专 门 编写 一 个 软件 ， 将 这 些 文件 转换 成 公共 的 格式 以 完成 上 述 处 理 过 程 。 同 样 ， 这 件 工 
作 也 是 相当 耗 时 且 昂 贵 的 。 

查询 一 成 不 变 / 应 用 程序 需 不 断 翻新 

从 终端 用 户 的 观点 看 ， 基 于 文件 的 系统 比 手工 系统 有 了 很 大 的 进步 。 很 自然 ， 用 户 又 提 
出 新 的 需求 或 者 要 求 修 改 原 有 查询 。 然 而 ， 基 于 文件 的 系统 是 完全 依赖 应 用 开发 人 员 的 ， 由 
应 用 开发 人 员 编 程 实现 所 有 要 求 的 查询 和 报表 。 这 将 会 产生 两 种 结果 。 在 一 些 单位 中 ， 查 询 
或 报表 的 类 型 是 固定 的 。 没 有 办 法 满足 那些 未 列 入 计划 的 查询 ( 即 突 发 奇想 的 查询 )， 无 论 
是 查询 数据 本 身 还 是 查询 哪 类 数据 可 用 。 

而 在 另 一 些 单位 中 ,不 断 翻 新 文件 和 应 用 程序 。 最 后 发 展 到 数据 处 理 部 门 不 堪 重 负 ， 仅 
用 现 有 的 资源 已 不 能 完成 所 有 的 工作 。 这 样 会 给 数据 处 理 部 门 的 员工 增加 很 大 的 压力 ， 绪 宁 
导致 程序 不 能 或 者 不 能 高 效 地 满足 用 户 要 求 ， 还 将 导致 文档 不 全 、 维 护 困 难 等 。 通 常情 况 
F, 下列 某 类 功能 不 得 不 被 舍弃 : 

e 不 能 提供 安全 性 和 完整 性 保护 。 

o 当 硬 件 或 软件 故障 发 生 时 ， 不 能 恢复 或 者 恢复 受 限 。 

e 在 某 一 时 刻 只 允许 一 位 用 户 对 文件 进行 访问 ， 不 支持 同一 个 部 门 的 员工 对 文件 的 共 

享 访问 。 
上 述 任何 一 种 情况 都 是 不 可 接受 的 ， 因 此 我 们 需要 另外 一 种 数据 管理 的 解决 方法 。 


1.3 数据 库 方法 


上 面 列 出 的 基于 文件 方法 的 种 种 局 限 性 可 以 归结 为 两 个 原因 : 

(1) 数据 的 定义 被 符 入 到 应 用 程序 中 ， 而 不 是 分 开 和 独立 地 存储。 

(2) 除了 应 用 程序 规定 之 外 的 那些 数据 访问 和 操作 无 法 得 到 控制 。 

为 了 变 得 更 加 高 效 ， 需 要 一 种 新 的 方法 。 数 据 库 和 数据 库 管理 系统 (Database 
Management System, DBMS) 应 运 而 生 。 在 本 节 中 ， 将 给 出 这 些 术语 的 更 为 正式 的 定义 ， 并 
且 讨 论 在 DBMS 环境 中 应 具有 哪些 功能 部 件 。 


1.3.1 数据 库 


| 数据 库 | 为 满足 某 个 组 织 机 构 的 信息 要 求 而 设计 的 一 个 逻辑 相关 数据 及 其 描述 的 共享 集 。 


让 我 们 来 研究 数据 库 的 这 个 定义 ， 从 而 完全 地 理解 这 个 概念 。 数 据 库 是 一 个 含有 大 量 数 
据 的 、 可 能 被 许多 部 门 和 用 户 同 时 使 用 的 大 数据 集 。 所 有 的 数据 项 都 被 集中 起 来 ， 具 有 很 少 
量 的 数据 元 余 ， 而 不 是 像 基 于 文件 的 系统 那样 ， 具 有 很 多 元 余数 据 的 不 相连 的 文件 。 数 据 库 
不 再 是 某 一 个 部 门 私有 的 ， 而 是 一 个 共享 的 资源 。 数 据 库 中 不 仅 含 有 组 织 的 运行 数据 ， 而 且 
还 含有 对 这 些 数据 的 描述 。 由 于 这 个 原因 ， 数 据 库 有 时 也 被 定义 为 一 组 集成 记录 的 自 描述 的 
集 。 数 据 的 描述 称 为 系统 目录 (也 称 为 数据 字典 或 元 数据 一 一 数据 的 数据 )。 正 是 数据 库 的 
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自我 描述 功能 才 提 供 了 程序 -~ 数据 独立 性 。 

数据 库 系 统 所 采用 的 数据 的 定义 与 应 用 程序 相 分 离 的 方法 ， 与 现代 软件 开发 使 用 的 对 
象 的 内 部 定义 和 外 部 定义 分 离 的 方法 十 分 类 似 。 对 象 的 使 用 者 只 能 看 到 对 象 的 外 部 定义 ， 而 
不 能 看 到 对 象 内 部 是 如 何 定义 以 及 如 何 工 作 的 。 这 种 方法 的 一 个 优点 称 为 数据 抽象 ， 是 指 假 
设 对 象 的 外 部 定义 保持 不 变 ， 可 以 任意 更 改 对 象 的 内 部 定义 ， 而 不 影响 用 户 正 常 使 用 该 对 
象 。 使 用 同样 的 方法 ， 数 据 库 方法 将 数据 结构 从 应 用 程序 中 分 离 出 来 ， 并 且 将 其 存储 在 数据 
库 中 。 如 果 要 添加 新 的 数据 结构 ， 或 者 已 有 的 数据 结构 需要 修改 ,假设 应 用 程序 与 正在 修改 
的 部 分 无 关 ， 它 们 将 不 会 受到 影响 。 例 如 ， 如 果 向 一 个 记录 添加 新 的 域 或 者 创建 一 个 新 的 文 
件 , 已 经 存在 的 应 用 不 会 受到 影响 。 然 而 ， 如 果 移 走 的 是 正在 被 一 个 应 用 程序 使 用 的 文件 中 
的 域 ， 那 么 这 个 应 用 当然 会 受 影响 ， 必 须 做 出 相应 的 修改 。 

数据 库 定义 中 最 后 一 个 应 该 解释 的 术语 是 “逻辑 相关 的 ”。 当 分 析 一 个 组 织 所 需要 的 信 
息 时 ， 总 是 试图 找 出 实体 、 属 性 和 联系 。 实 体 是 组 织 中 一 个 独立 的 、 将 要 在 数据 库 中 体现 出 
来 的 对 象 (人 、 地 点 、 东 西 、 概 念 或 者 事件 )。 属 性 描述 我 们 想 要 记录 的 对 象 的 某 一 方面 的 
特性 ， 联 系 描述 实体 之 间 的 关联 。 例 如 ， 图 1-6 表示 了 DreamHome 实例 的 一 个 部 分 实体 - 
联系 (ER) 图 ， 其 中 包括 : 

e 六 个 实体 (正方形 ): Branch, Staff, PropertyForRent, Client, PrivateOwner 和 Lease. 

e 七 种 联系 (靠近 连 线 的 名 字 ): Has, Offers, Oversees, Views, Owns, LeasedBy 和 Holds。 

e 六 个 属性 ， 每 个 实体 一 个 : branchNo, staffNo, propertyNo, clientNo, ownerNo 和 leaseNo。 
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1-6 ER 图 实例 


数据 库 能 表现 这 些 实体 、 属 性 和 实体 之 间 的 逻辑 联系 。 换 句 话说， 数据 库 含 有 在 逻辑 上 
相关 的 数据 。 第 12 章 和 第 13 章 将 详细 讨论 ER 模型 。 


1.3.2 ”数据 库 管 理 系统 (DBMS) 


| DBMS | 一 个 支持 用 户 对 数据 库 进行 定义 、 创 建 、 维 护 及 控制 访问 的 软件 系统 。 


DBMS 是 一 个 与 用 户 的 应 用 程序 和 数据 库 相 互 作 用 的 软件 。 典 型 情况 下 ，DBMS 提供 
下 列 功能 : 
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e RITA Pe BRE, iH Fe Aba et HEE LIB] (Data Definition Language, DDL). 
DDL 允许 用 户 指定 数据 类 型 、 数 据 结构 ， 以 及 被 存储 到 数据 库 中 的 数据 应 满足 的 约束 。 
允许 用 户 在 数据 库 中 插入 、 更 新 、 删 除 和 检索 数据 ， 通 常 这 些 工 作 是 通过 数据 操作 
语言 (Data Manipulation Language, DML) 完成 的 。 由 于 集中 存放 所 有 的 数据 和 数 
据 描述 ， 因 此 允许 DML 提供 一 个 对 这 些 数据 进行 一 般 查 询 的 机 制 ， 称 为 查询 语言 。 
查询 语言 的 提出 缓解 了 基于 文件 的 系统 中 的 一 些 问题 ， 如 用 户 只 能 执行 固定 的 查询 ， 
或 者 不 得 不 翻新 程序 而 给 软件 管理 带 来 困难 。 最 常见 的 查询 语言 是 结构 化 查询 语言 
(SQL， 读 作 “S-Q-L” 或 “See-Quel”)， 该 语言 现在 对 于 关系 型 DBMS 来 说 ， 既 是 
形式 的 也 是 实际 的 标准 语言 。 为 了 强调 SQL 的 重要 性 ， 我 们 将 第 6 一 9 章 和 附录 1 
的 篇 幅 都 用 于 深入 学 习 该 语言 。 

提供 数据 库 的 受 控 访 问 。 例 如 ， 它 可 以 提供 : 

@ 一 个 安全 系统 ， 禁 止 未 授权 的 用 户 访问 数据 库 。 

m 一 个 完整 的 系统 ， 保 持 所 存储 数据 的 一 致 性 。 

一 个 并 发 控制 系统 ， 人 允许 数据 库 的 共享 访问 。 

a 一 个 恢复 控制 系统 ， 能 够 将 数据 库 恢 复 到 出 现 硬件 或 软件 故障 之 前 的 某 个 一 致 状态 。 
a 一 个 用 户 可 访问 的 目录 ,该 目录 描述 了 数据 库 中 所 存储 的 数据 。 


1.3.3 (数据 库 ) 应 用 程序 


应 用 程序 | 通过 向 DBMS 提出 合适 的 请 求 (通常 是 一 个 SQL 语句 ) 而 与 数据 库 交 互 作 用 的 
计算 机 程序 。 


用 户 通过 若干 应 用 程序 与 数据 库 打 交道 ， 这 些 应 用 程序 负责 创建 、 维 护 数据 库 和 产生 信 
息 。 应 用 程序 可 以 是 一 般 批 处 理 方式 的 应 用 ， 也 可 以 是 在 线 应 用 ， 后 者 今天 更 常见 一 些 。 应 
用 程序 既 可 以 用 某 种 程序 语言 编写 也 可 用 某 种 更 高 级 的 第 四 代 语 言 。 

图 1-7 基于 图 1-5 解释 了 数据 库 方 法 。 它 表示 销售 部 门 和 合同 部 门 使 用 它们 各 自 的 应 用 程序 
通过 DBMS 访问 同一 个 数据 库 。 每 组 部 门 应 用 程序 处 理 该 部 门 目 己 的 数据 录入 、 文 件 维护 和 特 
定 报表 的 生成 。 然 而 ， 与 基于 文件 的 系统 相 比 ， 数 据 的 物理 结构 和 存储 是 由 DBMS 控制 的 。 


PropertyForRent, 
PrivateOwner, Client 
和 Lease 的 详细 信息 + 
文件 定义 
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合同 应 用 程序 





PropertyForRent (propertyNo, street, city, postcode, type, rooms, rent, ownerNo) 
PrivateOwner (ownerNo, fName, IName, address, telNo) 

Client (clientNo, fName, IName, address, telNo, preflype, maxRent) 

Lease (leaseNo, propertyNo, clientNo, paymentMethod, deposit, paid, rentStart, rentFinish) 


图 1-7 数据 库 处 理 
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视图 
视图 功能 使 DBMS 成 为 一 种 极其 强大 和 有 用 的 工具 。 然 而 ， 系 统 的 终端 用 户 一 般 并 不 
感 兴趣 对 于 系统 来 说 任务 的 难 易 程度 ， 所 以 可 能 有 一 些 人 会 认为 DBMS 将 事情 变 得 过 于 复 
杂 了 ， 因 为 他 们 现在 看 到 的 数据 比 实际 需要 和 想 要 的 数据 多 得 多 。 例 如 ,合同 部 门 本 只 和 需 
要 查看 关于 已 租用 房产 的 有 关 信 息 ， 如 图 1-5 所 示 ， 而 这 在 数据 库 方 法 中 已 经 被 改变 了 ， 如 
图 1-7 所 示 。 现 在 数据 库 还 含有 房产 类 型 、 房 间 数 量 以 及 业主 等 信息 。 为 解决 这 个 问题 ， 
DBMS 提供 了 另外 一 种 方便 的 方法 ， 称 为 视图 机 制 ， 允 许 每 一 位 用 户 对 数据 库 有 其 自己 的 视 
图 (一 个 视图 实际 上 是 数据 库 的 一 个 子 集 )。 例 如 ， 可 以 建立 一 个 视图 ， 人 允许 合同 部 门 只 看 
到 他 们 想 要 看 到 的 对 于 租用 房产 来 说 有 关 的 数据 信息 。 
除了 通过 允许 用 户 按 照 他 们 自己 的 视图 查看 数据 来 降低 复杂 度 外 ， 视 图 还 有 许多 其 他 
好 处 : 
© 视图 提供 了 一 个 保密 级 别 。 可 以 通过 建立 视图 将 一 些 用 户 不 能 查看 的 数据 排除 在 外 。 
例如 ， 可 以 建立 一 个 视图 ， 人 允许 部 门 经 理 和 工资 发 放 部 门 看 到 员工 的 所 有 信息 ， 包 
括 工资 的 详细 信息 ， 而 创建 另外 一 个 视图 ， 其 他 员工 可 通过 它 查 看 除了 工资 情况 以 
外 的 所 有 其 他 信息 。 
© 视图 提供 了 一 个 自 定义 数据 库 外 观 的 机 制 。 例 如 ， 合 同 部 门 可 能 希望 按 月 租金 数据 
项 (rent) 具有 一 个 更 加 明显 的 名 字 ， 如 Monthly Rent. 
o 当 基 本 数据 库 已 经 被 改变 时 (例如 ， 添 加 或 删除 数据 项 、 改 变 联系 、 分 裂 文件 、 重 
构 或 者 重新 命名 )， 视 图 机 制 仍 可 以 提供 与 原来 一 致 的 、 似 乎 未 变化 的 数据 库 结 构 。 
例如 ， 一 个 数据 项 被 添加 入 一 个 文件 或 从 一 个 文件 中 删除 ， 而 这 个 数据 项 不 含 在 视图 
里 的 话 ， 那 么 视图 将 不 会 受 影响 。 因 此 ， 视 图 有 助 于 提高 前 述 的 程序 - 数据 独立 性 。 
上 面 的 讨论 是 关于 DBMS 的 一 般 功 能 ， 实 际 系统 所 提供 的 功能 因 产 品 而 异 。 例 如 ， 个 
人 计算 机 的 DBMS 可 能 不 支持 并 发 的 共享 访问 ， 并 且 可 能 只 提供 有 限 的 安全 性 、 完 整 性 和 
恢复 控制 。 然 而 ， 现 代 的 、 较 大 的 多 用 户 DBMS 产品 提供 了 所 有 上 述 功能 ， 以 及 其 他 更 多 
的 附加 功能 。 现 代 系 统一 般 都 是 包含 上 百 万 行 代 码 和 大 量 文档 卷宗 的 十 分 复杂 的 软件 。 复 杂 
性 是 由 于 这 款 软件 必须 处 理 更 加 一 般 化 的 需求 。 时 至 今日 ， 人 们 要 求 DBMS 达到 完全 的 可 
靠 性 和 24/7 可 用 性 ( 即 一 天 24 小 时 ,一周 7 天 )， 即 使 在 出 现 硬件 或 软件 失败 的 情况 下 也 要 
这 样 。DBMS 正在 继续 扩展 ， 以 满足 最 新 的 用 户 要 求 。 例 如 ， 现 在 的 一 些 应 用 要 求 存储 图 
像 、 视 频 、 声 音 等 信息 。 为 了 达到 这 个 要 求 ，DBMS 必须 进行 某 种 改变 。 因 为 人 们 总 是 提 
出 新 的 功能 需求 ， 所 以 DBMS 的 功能 也 将 永远 不 会 静止 不 变 。 在 后 面 的 章节 中 我 们 将 介绍 
DBMS 的 基本 功能 。 


1.3.4 DBMS 环境 的 组 成 部 分 
可 以 将 DBMS 环境 看 成 由 五 部 分 组 成 : 硬件 、 软 件 、 数 据 、 过 程 和 人 ， 如 图 1-8 所 示 。 





图 1-8 DBMS 环境 
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硬件 

DBMS 和 应 用 的 运行 要 求 硬 件 支撑 。 硬 件 可 以 是 一 台 个 人 计算 机 、 一 台大 型 机 甚至 是 多 
台 计 算 机 连接 的 网 络 。 特 定 的 硬件 取决 于 组 织 机 构 的 要 求 和 所 使 用 的 DBMS。 一 些 DBMS 
只 能 在 特定 的 硬件 系统 和 操作 系统 上 运行 ， 而 另外 一 些 可 适用 于 各 种 硬件 系统 和 操作 系统 。 
DBMS 一 般 对 主 存 和 硬盘 空间 有 一 个 最 低 要 求 ， 但 在 此 低 限 上 不 能 保证 提供 可 接受 的 性 能 。 
在 图 1-9 中 显示 了 DreamHome 的 一 个 简化 硬件 结构 。 它 包含 一 个 微机 网 络 ， 网 络 中 的 核心 
计算 机 位 于 伦敦 ， 用 于 运行 DBMS 的 后 台 程序 ， 也 就 是 DBMS 中 处 理 和 控制 数据 库 访问 的 部 
分 。 此 外 还 有 许多 位 于 不 同 地 方 的 运行 DBMS 前 台 的 计算 机 ， 也 就 是 运行 DBMS 中 与 用 户 接 
口 的 部 分 ， 这 种 结构 称 为 客户 - 服务 器 体系 结构 : 后 台 是 服务 器 ， 前 台 是 客户 机 。 在 3.1 节 中 
将 讨论 这 种 类 型 的 体系 结构 。 





图 1-9 DreamHome 硬件 结构 


软件 

软件 部 分 包含 DBMS 软件 本 身 及 应 用 程序 和 操作 系统 ， 如 果 DBMS 是 在 网 络 中 使 用 
的 ， 则 还 包含 网 络 软件 。 典 型 情况 下 ， 应 用 程序 是 用 第 三 代 编 程 语 言 (3GL) 编写 的 ， 如 C、 
C++, C#, Java, Visual Basic, COBOL, FORTRAN, Ada 或 Pascal， 或 者 使 用 一 种 内 人 第 
三 代 语 言 中 的 第 四 代 编 程 语 言 (4GL) 编写 ， 如 SQL。 目标 DBMS 可 能 含有 它 自己 的 支持 
应 用 程序 快速 开发 的 第 四 代 工 具 ， 包 括 非 过 程 化 查询 语言 、 报 表 生 成 带 、 表 单 生 成 名 、 图 形 
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生成 器 及 应 用 生成 器 等 。 第 四 代 工 具 的 使 用 可 以 大 大 提高 软件 生产 率 ， 并 且 产 生 的 程序 易于 
维护 。 在 2.2.3 节 中 将 会 讨论 第 四 代 工 具 。 
数据 

从 终端 用 户 的 观点 看 , DBMS 环境 中 最 重要 的 部 分 可 能 就 是 数据 。 从 图 1-8 中 可 以 看 出 ， 
数据 在 机 器 和 人 中 间 起 到 了 桥梁 作用 。 数 据 库 同时 包含 了 操作 数据 和 元 数据 ， 即 “关于 数据 
的 数据 ”。 数 据 库 结构 称 为 模式 (schema), ÆR 1-7 中 ， 模 式 包 含 了 四 个 文件 (或 称 为 表 )， 
分 别 为 PropertyForRent、PrivateOwner、Client 和 Lease。PropertyForRent 表 有 八 个 字段 (或 
称 为 属性 )， 分 别 为 propertyNo、street、city、postcode、type (房产 类 型 )、rooms (房间 数量 )、 
rent (月 租金 ) 和 ownerNo。ownerNo 属性 反映 了 PropertyForRent 和 PrivateOwner 之 间 的 联 
R: 一 个 业主 拥有 (Owns) 出 租 的 房产 ， 如 图 1-6 中 的 ER 图 所 描述 的 那样 。 例 如 ， 在 图 1-2 
中 ,业主 CO46 名 叫 Joe Keogh， 拥 有 房产 PA14。 

元 数据 被 组 织 到 系统 目录 中 ， 系 统 目录 将 在 2.4 节 详 细 讨 论 。 
规程 

规程 指 的 是 对 数据 库 的 设计 和 使 用 进行 控制 的 一 组 命令 和 规则 。 系 统 用 户 和 管理 数据 库 
的 工作 人 员 要 求 提 供 关 于 如 何 使 用 和 运行 系统 的 文档 形式 的 规程 说 明 。 可 能 包括 说 明 如 何 进 
行 下 列 工 作 : 

e 登录 DBMS, 

e 使 用 某 个 特定 的 DBMS 工具 或 者 应 用 程序 。 

° 局 动 和 关闭 DBMS, 

e 创建 数据 库 备份 。 

o 处 理 硬 件 或 软件 失效 。 这 可 能 包含 如 何 识别 和 定位 失效 的 部 分 (例如 ， 打 电话 给 合 

适 的 硬件 工程 师 )， 以 及 随后 的 故障 修复 和 数据 库 恢复 等 。 
e 改变 表 结构 ， 重 新 组 织 跨 多 个 硬盘 的 数据 库 ， 改 良性 能 ， 或 在 辅助 存储 器 上 备份 数 
据 等 。 

人 

最 后 一 个 部 分 是 系统 中 涉及 的 人 。 在 1.4 节 中 再 讨论 这 个 部 分 。 


1.3.5 数据 库 设 计 : 范 型 改变 


到 目前 为 止 ， 我 们 一 直 认 为 数据 库 中 的 数据 是 有 结构 的 。 例 如 ， 在 图 1-7 中 已 经 确定 
了 四 个 表 : PropertyForRent、PrivateOwner、Client 和 Lease。 但 是 如 何 能 够 得 到 这 个 结构 呢 ? 
答案 很 简单 : 数据 库 的 结构 是 在 数据 库 设计 过 程 中 确定 的 。 然 而 ， 完 成 数据 库 的 设计 将 是 十 
分 复杂 的 工作 。 为 了 建立 一 个 满足 组 织 机 构 信 息 要 求 的 系统 ， 需 要 采用 与 基于 文件 的 系统 所 
不 同 的 方法 。 在 基于 文件 的 系统 中 ， 这 个 工作 是 由 单个 部 门 的 应 用 需求 驱动 的 。 数 据 库 方 法 
在 要 显示 出 自身 的 优势 ， 必 须 首先 考虑 数据 ， 然 后 再 考虑 应 用 。 这 种 方法 上 的 改变 称 为 范 型 
改变 。 系 统 是 否 被 终端 用 户 接受 ， 数 据 库 的 设计 工作 是 关键 。 设 计 很 差 的 数据 库 将 会 导致 做 
出 错误 决定 ， 并 且 会 对 组 织 产 生 严 重 的 负面 影响 。 而 另 一 方面 ， 设 计 良 好 的 数据 库 将 会 产生 
一 个 系统 ， 这 个 系统 能 够 给 某 些 决策 提供 正确 的 信息 ， 从 而 以 高 效 的 方法 取得 正确 的 结果 。 

本 书 的 目的 是 帮助 大 家 完成 范 型 改变 。 本 书 用 了 许多 章节 完整 讨论 了 数据 库 设计 方法 学 
(参见 第 16~ 19 章 )。 我 们 将 其 组 织 为 一 系列 循序 渐进 的 步骤 ,并 且 穿 插 了 知 干 规则 。 例 如 ， 
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在 图 1-6 所 示 的 ER 图 中 ， 有 六 个 实体 、 七 个 联系 及 六 个 属性 ， 设 计 方 法 学 就 给 出 了 如 何 找 
出 在 数据 库 中 必须 标识 的 实体 、 联 系 和 属性 的 规则 。 

然而 遗憾 的 是 ， 数 据 库 设计 方法 学 并 没有 被 普遍 接受 。 大 多 数 的 单位 和 个 人 设计 人 员 很 
少 依 赖 方法 学 来 指导 数据 库 的 设计 ， 这 也 被 认为 是 导致 数据 库 应 用 开发 中 产生 错误 的 主要 原 
因 。 正 是 由 于 数据 库 设计 时 缺乏 结构 化 方法 ， 致 使 数据 库 工程 所 需要 的 时 间 和 资源 常常 被 低 
佑 ， 造 成 数据 库 开 发 不 当 或 不 能 有 效 地 满足 应 用 的 需求 ， 或 文档 不 全 、 维 护 困难 ， 等 等 。 


14 数据 库 环 境 中 的 各 种 角色 


本 节 将 讨论 前 一 节 所 述 DBMS 环境 中 的 第 五 个 组 成 部 分 一 人。 可 以 明确 区 分 出 与 
DBMS 环境 有 关 的 四 种 不 同类 型 的 人 : 数据 和 数据 库 管 理 员 、 数 据 库 设计 人 员 、 应 用 开发 人 
员 和 终端 用 户 。 


1.4.1 数据 管理 员 和 数据 库 管理 员 


数据 库 和 DBMS 都 是 公共 资源 ， 必 须 像 其 他 所 有 公共 资源 一 样 进 行 管理 。 数 据 和 数据 
库 管 理 员 通常 负责 管理 和 控制 DBMS 及 存储 数据 。 数 据 管理 员 (DA) 的 责任 是 : 管理 数据 
资源 ， 包 括 数据 库 规划 ; 开发 和 维护 的 标准 、 策 略 和 规程 ; 概念 /逻辑 数据 库 设计 。 数 据 管 
理 员 与 高 级 经 理 进行 协商 ， 确 保 数据 库 开 发 最 终 能 支持 共同 目标 。 

数据 库 管 理 员 (DBA) 负责 数据 库 的 物理 实现 ， 包 括 物理 数据 库 设 计 和 实现 、 安 全 性 和 
完整 性 控制 、 最 终 运 行 系统 的 维护 ， 以 及 确保 应 用 程序 能 满足 用 户 的 需要 。 数 据 库 管理 员 比 
数据 管理 员 更 加 偏向 于 技术 ， 需 要 对 目标 DBMS 和 系统 环境 有 相当 的 了 解 。 在 某 些 组 织 机 
构 中 ， 这 两 类 管理 员 几 乎 没有 明显 的 差别 ， 而 在 男 一 些 组 织 机 构 中 ， 为 强调 共享 资源 的 重要 
性 ,分 配 团 队 不 同人 员 来 担任 这 些 不 同 的 角色 。20.6 节 将 更 详细 地 讨论 数据 和 数据 库 管 理 。 


1.4.2 ”数据库 设计 人 员 


在 大 型 的 数据 库 设 计 项 目 中 ， 可 以 区 分 两 种 类 型 的 设计 人 员 : 逻辑 数据 库 设计 人 员 和 物 
理 数 据 库 设 计 人 员 。 逻 辑 数据 库 设 计 人 员 负 责 标识 数据 (也 就 是 实体 和 属性 )、 数 据 之 间 的 
联系 ， 以 及 对 将 存储 到 数据 库 的 数据 的 约束 。 逻 辑 数 据 库 设计 人 员 必 须 对 组 织 机 构 的 数据 以 
及 对 这 些 数 据 的 约束 (约束 有 时 也 称 为 业务 规则 ) 有 一 个 全 面 的 理解 。 约 束 描述 了 从 组 织 机 
构 的 观点 看 到 的 数据 的 主要 特性 。 关 于 DreamHome 案例 的 约束 有 : 
e 一 位 员工 不 能 同时 管理 多 于 100 处 竺 出租 或 出 售 的 房产 。 
e 员工 不 能 处 理 他 们 自己 所 有 房产 的 出 租 或 出 售 业 务 。 
e 一 位 当事人 不 能 同时 既是 房产 的 购买 者 又 是 房产 的 出 售 者 。 
为 了 变 得 更 有 效 ， 逻 辑 数据 库 设 计 人 员 在 数据 模型 的 开发 过 程 中 ， 必 须 考虑 所 有 数据 库 
用 户 的 视图 ， 并 且 应 该 尽早 考虑 。 在 本 书 中 ， 将 逻辑 数据 库 设 计 人 员 的 工作 分 成 两 步 : 
e 概念 数据 库 设 计 。 这 一 步 与 实现 的 细节 ， 如 目标 DBMS 、 应 用 程序 、 编 程 语言 或 者 
其 他 物理 上 的 考虑 是 不 相关 的 。 
© 逻辑 数据 库 设计 。 以 一 个 特定 的 数据 模型 作为 目标 ， 例 如 关系 的 、 网 状 的 、 层 次 的 
或 者 面向 对 象 的 数据 模型 。 
物理 数据 库 设计 人 员 决 定 逻 辑 数据 库 的 设计 如 何以 物理 的 形式 实现 ， 包 括 : 
© 将 逻辑 数据 库 设 计 映 射 为 一 组 表 和 一 组 完整 性 约束 。 
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o 为 了 得 到 最 佳 性 能 ， 选 择 特定 的 数据 存储 结构 和 访问 方法 。 

© 设计 所 要 求 的 数据 安全 性 检查 。 

物理 数据 库 设计 的 许多 工作 很 大 程度 上 依赖 于 目标 DBMS, ， 并 且 实 现 一 个 机 制 往 往 存 在 
多 种 途径 。 因 此， 物理 数据 库 设 计 人 员 必 须 完全 了 解 目标 DBMS 的 功能 ， 并 且 必 须 理解 每 
一 种 特定 实现 方法 的 优 缺点 。 物 理 数据 库 设计 人 员 必 须 能 够 选择 一 个 合适 的 、 充 分 考虑 到 数 
据 使 用 场景 的 存储 策略 。 概 念 和 逻辑 数据 库 设计 与 干什么 相关 ， 而 物理 数据 库 设计 与 怎么 干 
相关 。 这 需要 不 同 的 技巧 ， 而 这 些 技巧 通常 是 因 人 而 异 的 。 第 16 章 介绍 概念 数据 库 设 计 方 
法 学 ， 第 17 章 介绍 逻辑 数据 库 设计 方法 学 ， 第 18 和 19 章 介绍 物理 数据 库 设计 方法 学 。 


1.4.3 ”应 用 开发 人 员 


数据 库 一 旦 实现 后 ， 必 须 开发 满足 终端 用 户 功 能 需求 的 应 用 程序 。 这 就 是 应 用 开发 人 
员 的 任务 。 典 型 情况 下 ， 应 用 开发 人 员 从 一 个 由 系统 分 析 员 提出 的 描述 开始 工作 。 每 一 个 程 
序 都 包含 请 求 DBMS 在 数据 库 上 完成 某 些 操 作 的 语句， 包括 检索 、 插 入 、 更 新 和 删除 数据 。 
如 前 所 述 ， 程序 可 以 用 第 三 代 编 程 语 言 或 者 第 四 代 编 程 语言 编写 。 


14.4 ”终端 用 户 


终端 用 户 是 数据 库 的 “客户 ”， 设计 、 的 AA 

服务 。 终 端 用 户 可 以 根据 他 们 使 用 系统 的 途径 不 同 而 分 为 : 

。 简单 用 户 一 般 是 不 了 解 DBMS 的 用 户 。 他 们 通过 特殊 编写 的 、 试 图 将 操作 变 得 尽量 
简单 的 应 用 程序 访问 数据 库 。 通 过 简单 的 命令 或 者 选择 某 个 菜单 项 激活 数据 库 操作 。 
这 意味 着 他 们 并 不 需要 了 解 任何 数据 库 或 者 DBMS 的 信息 。 例 如 ， 当 地 超市 的 售 贷 
员 使 用 条 形 码 阅读 器 找 出 商品 的 价格 。 此 时 ， 另 有 专门 的 应 用 程序 负责 阅读 条 形 码 ， 
在 数据 库 中 查找 商品 价格 并 在 售 货 机 上 显示 出 这 个 价格 ， 同 时 完成 减少 数据 库 中 该 
商品 的 库存 数量 等 工作 。 

。 熟练 的 用 户 。 另 一 类 完全 相反 的 情况 是 ， 熟 练 的 终端 用 户 对 于 数据 库 的 结构 和 
DBMS 提供 的 便利 功能 相当 熟悉 。 熟 练 的 用 户 可 以 使 用 高 级 的 查询 语言 (如 SQL) 
来 完成 要 求 的 操作 。 一 些 熟 练 的 用 户 甚至 可 以 为 他 们 上 自己 的 使 用 需求 编写 应 用 程序 。 


15 ”数据库 管 理 系 统 的 历史 


如 前 所 述 ，DBMS 的 前 身 是 基于 文件 的 系统 。 然 而 ， 历 史上 并 不 存在 一 个 严格 的 分 界 
线 ， 表 明 数 据 库 时 代 开 始 ， 基 于 文件 的 系统 时 代 结 束 。 实 际 上 ;， 在 特定 的 领域 中 ， 基 于 文件 
的 系统 仍 在 使 用 。 已 经 有 人 提出 ，DBMS 是 在 20 世纪 60 年 代 的 阿波 罗 登 月 计划 中 出 现 的 ， 
该 计划 是 为 了 响应 时 任 美国 总 统 肯 尼 迪 提出 的 在 20 世纪 60 年 代 末 将 人 送 上 月 球 的 号 召 而 发 
起 的 。 当 时 ， 没 有 任何 一 个 系统 可 以 胜任 处 理 和 管理 这 个 计划 中 可 能 产生 的 巨大 数据 量 。 

结果 ， 计划 主要 承担 者 一 一 美国 北美 航空 公司 ( NAA， 现在 是 洛克 维尔 国际 组 织 ) 开发 
了 著名 的 软件 GUAM ( Generalized Update Access Method， 通 用 的 更 新 访问 方法 )。GUAM 
是 基于 这 样 一 个 概念 : 多 个 较 小 构件 组 成 较 大 构件 ， 直 到 组 装 成 最 终 的 产品 。 这 符合 倒置 树 
的 结构 ， 也 称 为 层次 结构 。 在 20 世纪 60 年 代 中 期 ,IBM 加 入 NAA 中 , 将 GUMA 发 展 成 
现在 称 为 IMS (Information Management System， 信 息 管 理 系统 ) WAS. IBM 限制 IMS 1% 
用 于 管理 层次 记录 ， 是 为 了 有 效 使 用 顺序 存储 设备 ， 特 别 是 磁带 ， 这 符合 当时 的 市 场 需求 。 
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这 个 限制 在 后 来 被 放松 了 。 虽 然 是 最 早 的 商品 化 DBMS 2—, IMS 现在 仍然 是 最 主要 的 层 
次 DBMS ， 被 许多 大 型 机 装载 使 用 。 

在 20 世纪 60 年 代 中 期 ， 另 一 个 主要 的 成 就 来 自 于 美国 通用 电气 公司 的 IDS (Integrated 
Data Store， 综 合 数据 存储 器 )。 这 项 工作 是 由 最 早 的 数据 库 系统 的 倡导 者 之 一 一 一 Charles 
Bachmann 所 领导 的 。 这 导致 了 一 个 新 型 的 、 称 为 网 状 DBMS 的 数据 库 系统 的 出 现 ， 对 那 
个 时 代 的 信息 系统 产生 了 深远 的 影响 。 网 状 数据 库 得 以 发 展 的 原因 一 部 分 是 为 了 解决 复杂 得 
不 能 被 层次 结构 模型 化 的 数据 关系 ， 一 部 分 是 为 了 强调 数据 库 标准 。 为 了 帮助 建立 这 样 的 标 
准 ， 包 含 了 美国 政府 和 工商 界 代 表 的 数据 系统 语言 会 议 (CODASYL) 在 1965 年 成 立 了 表 处 
理 任务 组 ， 后 来 在 1967 年 更 名 为 数据 库 任 务 组 ( Data Base Task Group，DBTG)。DBTG 的 
参考 术语 定义 了 数据 库 环境 的 标准 规范 ， 涉 及 数据 库 创建 和 数据 操作 等 内 容 。1969 年 发 布 
了 DBTG 草案 ， 第 一 个 正式 的 报告 于 1971 年 面世 。DBTG 报告 包含 三 个 部 分 : ， 

e 网 状 模式 : DBA 所 看 到 的 整个 数据 库 的 逻辑 结构 ， 包 含 数 据 库 名 称 的 定义 、 每 个 记 
录 的 类 型 ， 以 及 每 个 记录 类 型 的 内 部 组 成 。 

e FRR: 用 户 或 者 应 用 程序 所 看 到 的 数据 库 部 分 。 

e 一 种 数据 管理 语言 ， 用 于 定义 数据 属性 和 结构 以 及 操作 数据 。 

为 了 标准 化 ，DBTG 指定 了 三 种 不 同 的 语言 : 

e 模式 DDL， 帮 助 DBA 定义 模式 。 

e 子 模式 DDL， 帮 助 应 用 程序 定义 它们 需要 的 数据 库 部 分 。 

e DML， 用 于 操作 数据 。 

尽管 这 个 报告 没有 被 美国 国家 标准 协会 (ANSI) 正式 接受 ,但 一 些 系统 后 来 还 是 按照 
DBTG 的 方案 进行 开发 。 这 些 系统 就 是 大 家 所 知道 的 CODASYL 或 DBTG 系统 ,CODASYL 
和 层次 方法 代表 了 第 一 代 DBMS。 可 以 在 本 书 的 网 站 (URL 可 在 前 言 中 找到 ) 上 看 到 这 些 系 
统 的 详细 描述 。 然 而 ， 这 两 种 数据 模型 有 以 下 基本 的 不 足 : 

© 必须 编写 复杂 的 程序 ， 即 使 是 只 需要 完成 基于 记录 访问 的 简单 查询 。 
e 数据 的 独立 性 差 。 
e 没有 被 广泛 接受 的 理论 基础 。 

1970 Æ, IBM 研究 实验 室 的 E. F. Codd 发 表 了 一 篇 具有 很 大 影响 的 关于 关系 数据 模型 
的 论文 。 这 篇 论文 的 发 表 十 分 及 时 ， 解 决 了 之 前 方法 的 不 足 之 处 。 从 那 以 后 ， 许 多 试验 性 
的 关系 DBMS 被 开发 ， 并 且 在 20 世纪 70 年 代 末 、80 年 代 初 出 现 了 最 早 的 商业 产品 。 其 中 
最 引 人 注 意 的 是 加 利 福 尼 亚 州 的 IBM San José 研究 实验 室 的 System R 项 目 ， 该 项 目 是 在 20 
世纪 70 年 代 末 开发 的 (Astrahan et al.，1976 )。 这 个 项 目的 开发 则 在 通过 实现 数据 结构 和 操 
作 来 证 明 关 系 模型 的 实用 性 ， 并 且 直 接 导 致 了 两 个 成 果 : 

e 结构 查询 语言 一 一 SQL 的 问世 ， 这 个 语言 从 那 时 起 成 为 关系 DBMS 的 标准 语言 。 
e 自 20 世 纪 80 年 代 起 各 类 商品 化 关系 DBMS 产品 层出不穷 ， 例如 IBM 的 DB2、 
SQL/DS 和 Oracle 公司 的 Oracle 等 。 

现在 已 经 有 了 几 百 个 面 回 大 型 机 和 PC 环境 的 关系 DBMS， 尽 管 其 中 的 许多 对 关系 模型 
定义 进行 了 扩展 。 另 外 一 些 多 用 户 的 关系 DBMS 的 例子 包括 Oracle 公司 的 MySQL 、Actian 
公司 的 Ingres, Microsoft 的 SQL Server 和 IBM 公司 的 Informix。 基 于 个 人 计算 机 的 关系 
DBMS 包括 Microsoft 的 Office Access 和 Visual FoxPro, Embarcadero Technologies 公司 的 
InterBase 和 Jdatastore 以 及 R:Base Technologies 7 F] MY) R:Base, KA DBMS 被 称 为 第 二 代 
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DBMS。 第 4 章 将 讨论 关系 数据 模型 。 

关系 模型 并 非 没有 缺点 ， 尤 其 是 其 受 限 的 建 模 能 力 。 长 久 以 来 有 许多 研究 试图 解决 这 个 
问题 。1976 年 Chen 曾 提出 了 实体 - 联系 模型 ， 现 在 已 被 广泛 接受 为 概念 数据 库 设 计 技 术 ， 
并 将 作为 本 书 第 16 和 17 章 内 容 的 基础 。1979 年 ，Codd 试图 通过 一 个 称 为 RM/T (1979 ) 
和 后 续 的 RMV2 (1990) 的 关系 模型 扩展 版 本 ， 来 解决 他 初始 工作 中 的 一 些 不 足 之 处 。 扩 
展 关 系 模型 更 加 接近 于 实际 世界 的 描述 ， 被 统一 归 类 为 语义 数据 建 模 。 

为 了 适应 越 来 越 复 杂 的 数据 库 应 用 ， 出 现 了 两 类 新 的 系统 : 面向 对 象 的 DBMS 
( OODBMS) 和 对 象 关 系 的 DBMS ( ORDBMS)。 人 然而， 不同 于 先前 的 各 种 数据 模型 ， 这 
些 模型 的 实际 组 成 并 不 清晰 。 这 些 演 变 导 致 了 第 三 代 DBMS 的 出 现 ， 将 在 本 书 第 9 章 和 第 
27 ~ 28 章 详 细 讨论 。 

进入 20 世纪 90 ÆR, Internet, ZJZ C/S 结构 、 单 位 的 数据 库 必须 与 Web 应 用 集成 
成 为 趋势 ， 势 不 可 挡 。90 年 代 后 期 又 出 现 了 XML (可 扩展 标记 语言 )， 它 对 IT 的 许多 方面 
产生 了 显著 影响 ， 包括 数据 集成 、 图 形 界 面 、 峙 入 式 系统 、 分 布 式 系统 和 数据 库 系统 。 我 们 
将 在 第 29 和 30 章 分 别 讨论 Web 数据 库 集 成 和 XML。 

一 些 专 门 的 DBMS 也 被 推出 ， 例 如 数据 仓库 。 数 据 仓库 能 从 不 同 的 数据 源 抽取 数据 ， 
这 些 数据 源 可 能 原本 是 由 组 织 机 构 内 不 同 部 门 分 别 维护 的 。 数 据 仓库 这 类 系统 提供 数据 分 析 
机 制 ， 可 理解 的 分 析 结 果 能 用 于 决策 支持 ,例如 找 出 历史 趋势 之 类 。 所 有 主流 的 数据 库 供 应 
商都 给 出 了 数据 仓库 解决 方案 。 我 们 将 在 第 31 ~ 32 章 讨 论 数据 仓库 。 专 用 系统 的 另 一 个 例 
子 是 企业 资源 规划 (ERP), 它 一 般 是 建 在 DBMS 之 上 的 一 个 应 用 层 ;， 集成 了 一 个 组 织 机 构 
的 所 有 业务 功能 ， 包 括 制造 、 销 售 、 财 务 、 市 场 、 运 输 、 库 存 和 人 力 资 源 。 流 行 的 ERP A 
统 有 SAP 的 SAP R/3 和 Oracle 的 PeopleSoft。 图 1-10 总 结 了 数据 库 系 统 的 发 展 史 。 


20 世纪 60 年 代 (之 前 ) | 基于 文件 的 系统 数据 库 系统 的 前 身 。 不 集中 的 方法 : 每 个 部 门 存储 和 控制 自 
己 的 数据 
代表 第 一 代 DBMS。 最 重要 的 层次 系统 是 IBM 的 IMS， 最 
20 世纪 60 年 代 中 期 层次 和 网 状 数据 模型 | 重要 的 网 状 系统 是 计算 机 联合 公司 的 IDMS/R 。 缺 乏 数 据 独 立 
性 并 且 需 要 开发 复杂 的 程序 来 处 理 数 据 
E. F. Codd 发 表 了 划时代 的 论文 “大 型 共享 数据 集 上 的 关系 
在 此 期 间 出 现 了 两 个 最 重要 的 原型 : A oe A A E KS 
20 世纪 70 年 代 开发 出 原型 RDBMS | Ingres MA ( 始 于 1970 年 ) 和 地 处 加 州 的 IBM 圣何塞 实验 室 的 
System R MA ( 始 于 1974 年 )。 后 者 导致 SQL 的 出 现 
陈 氏 发 表 论 文 “ 实 体 -关系 模型 一 一 走向 统一 的 数据 视图 ”。 
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SQL 由 ISO (国际 标准 化 组 织 ) 标准 化 。SQL 的 后 续 标 准 分 

1987 年 ISO SQL 标准 别 发 布 于 1989 , 1992 (SQL2) 1999 (SQL:1999) , 2003 (SQL:2003)、 
2008 (SQL:2008) 和 2011 (SQL:2011) 

, z HEI OODBMS 和 OR 这 期 间 先 出 现 OODBMS ， 后 出 现 ORDBMS ( 1997 年 发 布 带 


图 1-10 ”数据 库 系 统 发 展 史 


! 原 型 
; 商品 化 RDBMS, il Oracle, Ingres 和 DB2 出 现 ， 它 们 代表 
人 i 4 : A 
1979 年 书 现 商品 化 RDBMS 着 第 二 代 DBMS 
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20 世纪 90 年 代 出 现 数据 仓库 系统 这 期 间 主 要 的 DBMS 开发 商 发 布 了 数据 仓库 系统 及 随后 的 数 
据 控 掘 产品 
ve : 第 一 代 互 联网 数据 库 应 用 出 现 。DBMS 开发 商 和 第 三 方 软件 
20 世纪 90 年 代 中 期 | Web 数据 库 集 成 。 | 开发 商都 认识 到 互联 网 的 重要 性 ,积极 支 持 Web 数据 库 集成 
W3C 批准 了 XML 1.0。 XML 能 与 DBMS 产品 集成 并 且 开发 








图 1-10 ( 续 ) 


1.6 DBMS 的 优点 和 缺点 

数据 库 管 理 系统 具有 许多 显著 的 优点 。 然 而 事物 都 是 一 分 为 二 的 ， 它 也 有 人 缺 点。 本 节 将 
研究 这 些 优 缺点 。 
优点 

数据 库 管 理 系 统 的 优点 在 表 1-2 中 列 出 。 


表 1-2 DBMS 的 优点 









受 控 的 数据 元 余 经 济 合 算 的 规模 

数据 一 致 性 平衡 各 种 需求 冲突 

相同 数据 量 表示 更 多 信息 增强 的 数据 可 访问 性 和 响应 性 
数据 共享 提高 的 生产 率 

增强 的 数据 完整 性 通过 数据 的 独立 性 增强 可 维护 性 
增强 的 安全 性 提高 的 并 发 性 





强制 执行 标准 增强 的 备份 和 恢复 服务 


受 控 的 数据 元 余 。 在 1.2 节 中 曾经 讨论 过 ， 传 统 的 基于 文件 的 系统 由 于 在 几 个 文件 中 同 
时 存储 相同 的 信息 而 浪费 空间 。 例 如 ， 在 图 1-5 中 ， 在 销售 部 门 和 合同 部 门 同时 存储 了 用 于 
出 租房 产 和 客户 的 相同 数据 信息 。 而 数据 库 方 法 则 通过 将 文件 集成 来 避免 存储 多 个 数据 备 
份 ， 从 而 消除 元 余 。 然 而 ， 数 据 库 方 法 并 不 是 消除 所 有 宛 余 ， 而 是 控制 数据 库 内 的 元 余 。 有 
时 为 了 表示 实体 之 间 的 联系 ， 重复 存储 某 些 关键 数据 项 是 必要 的 。 在 男 一 些 情 形 下 ,为 了 
提高 性 能 也 将 重复 存储 一 些 数据 项 。 在 阅读 了 后 面 几 章 后 ,我 们 将 对 受 控 元 余 有 更 清楚 的 
认识 。 

数据 一 致 性 。 消 除 和 控制 宗 余 同时 也 降低 了 发 生 不 一 致 性 的 可 能 性 。 很 显然 ， 如 果 一 个 
数据 项 在 数据 库 中 仅 存 储 一 次 ， 则 对 它 的 更 新 也 只 需要 进行 一 次 ， 新 的 值 马上 就 能 被 所 有 的 
用 户 看 到 。 如 果 一 个 数据 在 数据 库 中 不 只 存储 一 次 ， 但 系统 掌握 情况 ， 则 系统 能 够 保证 这 个 
数据 项 的 所 有 备份 一 致 。 令 人 遗憾 的 是 ， 当 代 的 许多 DBMS 尚 不 能 自动 保证 这 类 一 致 性 。 

相同 数据 量 表示 更 多 信息 。 通 过 对 集成 数据 的 操作 ， 组 织 机 构 能 从 相同 数量 的 数据 中 导 
出 额外 的 信息 。 例 如 ， 在 图 1-5 所 示 的 基于 文件 的 系统 中 ,合同 部 门 不 可 能 知道 已 经 出 租 的 
房产 归 谁 拥有 。 同 样 ， 销 售 部 门 也 不 可 能 知道 租赁 合同 的 详细 信息 。 但 当 把 这 些 数据 集成 在 
一 起 时 ， 合 同 部 门 就 可 以 访问 业主 的 详细 信息 ， 销 售 部 门 也 可 以 访 间 租赁 合同 的 详细 信息 。 
这 就 是 从 同样 数量 的 数据 中 得 到 更 多 的 信息 。 
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数据 共享 。 通常 文 件 是 由 使 用 它 的 人 或 者 部 门 拥有 。 但 数据 库 属于 整个 组 织 机 构 ， 可 
以 被 所 有 授权 的 用 户 共 享 。 这 样 一 来 ， 用 户 越 多 ， 共 享 的 数据 越 多 。 并 且 ， 新 的 应 用 可 以 在 
数据 库 中 原 有 数据 的 基础 上 增加 新 数据 ， 而 不 需 从 头 定 义 所 有 数据 。 新 应 用 自然 也 能 利用 
DBMS 提供 的 功能 ， 例 如 数据 定义 和 操作 、 同 步 和 恢复 控制 等 ， 而 不 需要 自己 再 实现 这 些 
功能 。 

增强 的 数据 完整 性 。 数 据 库 的 完整 性 指 的 是 存储 的 数据 的 有 效 性 和 一 臻 性。 完整 性 通常 
用 完整 约束 表达 ， 约 束 指 的 是 数据 库 不 能 违反 的 一 致 性 规则 。 约 束 可 以 应 用 于 单条 记录 中 的 
数据 项 ， 也 可 以 应 用 于 记录 之 间 的 联系 。 例 如 ， 一 条 完整 性 约束 可 能 规定 一 个 员工 的 工资 不 
能 超过 40 000 英镑 ; 或 者 规定 在 一 个 员工 的 记录 中 ， 代表 该 员工 所 工作 部 门 的 部 门 编号 必 
须 对 应 于 一 个 具体 存在 的 部 门 。 此 外 ， 数 据 库 的 集成 性 使 得 完整 性 约束 可 以 由 DBA 确定 ， 
而 由 DBMS 执行 检查 。 

增强 的 安全 和 性。 数据 库 的 安全 性 是 指 保护 数据 库 不 被 未 经 授权 者 访问 。 如 果 没 有 适当 的 
安全 性 检查 ， 数 据 库 的 集成 性 使 得 数据 相 比 在 基于 文件 的 系统 中 更 易 受 到 攻击 。 然 而 ， 其 集 
成 性 也 使 得 数据 库 安全 性 能 由 DBA 确定 ， 而 由 DBMS 执行 检查 。 这 里 可 能 会 采取 用 户 名 和 
密码 的 方式 来 识别 授权 使 用 数据 库 的 用 户 。 授 权 用 户 对 数据 库 的 访问 也 可 以 采用 限制 操作 类 
RR. HA, Ber. MWE) 的 方法 。 例 如 ，DBA 可 以 访问 数据 库 中 所 有 的 数据 ; MIA 
理 只 可 以 访问 所 有 与 他 部 门 相关 的 数据 ; 而 销售 人 员 可 以 访问 所 有 与 房产 有 关 的 数据 ， 但 不 
能 访问 其 他 敏感 数据 ， 如 员工 工资 的 详细 信息 等 。 

强制 执行 标准 。 集 成 性 使 得 DBA 能 定义 和 强制 执行 一 些 必要 的 标准 。 这 些 标准 可 能 包 
括 部 门 的 、 组 织 的 、 国 家 的 其 至 国际 的 。 例 如 ， 为 了 便于 在 系统 之 间 交 换 数据 而 采用 标准 的 
数据 格式 、 命 名 法 、 文 档 规范 、 更 新 规程 和 访问 规则 等 。 

经 济 合 算 的 规模 。 将 组 织 机 构 内 的 所 有 运行 数据 组 合 到 一 个 数据 库 中 ， 针 对 这 同一 个 数 
据 源 来 创建 各 种 应 用 ， 当 然 可 以 节省 费用 。 与 采用 基于 文件 的 系统 不 同 ， 原 本 分 给 每 个 部 门 
的 开发 和 维护 费用 此 时 可 以 统一 管理 ， 结 果 必 将 降低 整体 费用 ， 达 到 更 经 济 合算 的 规模 。 归 
总 后 的 预算 也 可 用 来 购置 更 加 适宜 整个 组 织 机 构 应 用 的 系统 配置 。 这 样 的 系统 有 可 能 是 一 个 
大 型 的 、 功 能 强大 的 计算 机 ， 或 者 是 由 许多 小 型 计算 机 组 成 的 网 络 。 

平衡 各 种 需求 冲突 。 每 一 个 用 户 或 者 部 门 的 需求 都 有 可 能 与 其 他 用 户 的 需求 产生 冲突 。 
由 于 数据 库 是 在 DBA 的 控制 下 ， 所 以 DBA 可 以 对 数据 库 的 设计 和 操作 性 使 用 做 若干 决策 ， 
使 得 组 织 机 构 作 为 一 个 整体 实现 最 佳 的 资源 使 用 。 决 策 时 可 能 会 以 牺牲 不 重要 的 应 用 作为 代 
价 ， 从 而 为 重要 的 应 用 提供 优良 的 性 能 。 

增强 的 数据 可 访问 性 和 响应 性 。 同 样 是 数据 集成 的 结果 ， 原 来 由 各 部 门 条 块 分 割 的 数 
据 现 在 都 可 以 由 终端 用 户 直 接 访 问 了 。 这 样 无 疑 能 提供 功能 更 加 强大 的 系统 ， 为 终端 用 户 或 
者 是 组 织 机 构 的 客户 提供 更 优质 的 服务 。 目 前 许多 DBMS 提供 查询 语言 和 报表 生成 等 功能 ， 
允许 用 户 在 自己 的 终端 即席 提问 ， 直 接 得 到 查询 结果 ， 而 不 需要 再 有 程序 员 帮 助 编写 程序 并 
从 数据 库 中 提取 这 些 信 息 。 例 如 ， 一 个 部 门 经 理 可 以 通过 在 终端 输入 下 列 SQL 语句 ， 列 出 
所 有 月 租金 高 于 400 英镑 的 公寓 房 : 

SELECT * 


FROM PropertyForRent 
WHERE type = ‘Flat’ AND rent > 400; 


提高 的 生产 率 。 如 前 所 述 ，DBMS 提供 许多 标准 的 功能 ， 这 些 功能 在 基于 文件 的 应 用 
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系统 中 通常 需要 程序 员 自 己 编写 。 在 基础 层 上 ，DBMS 提供 所 有 应 用 程序 中 典型 的 低层 文件 
处 理 例 程 。 这 样 一 来 ， 程 序 员 能 够 集中 精力 满足 用 户 提出 的 特殊 功能 要 求 ， 而 不 必 分 心 低层 
的 实现 细节 。 许 多 DBMS 还 提供 第 四 代 环 境 ， 它 由 许多 能 简化 数据 库 应 用 开发 的 工具 组 成 。 
这 使 得 程序 员 能 提高 生产 率 ， 缩 短 开发 时 间 (相应 地 减少 费用 )。 

通过 数据 独立 性 增强 可 维护 性 。 在 基于 文件 的 系统 中 ， 数 据 的 描述 和 数据 访问 逻辑 都 建 
立 在 应 用 程序 中 ， 使 得 程序 依赖 于 数据 。 任 何 对 于 数据 结构 的 修改 ， 比 如 将 40 个 字符 长 的 
地 址 改 成 41 个 字符 ， 或 者 改变 数据 在 磁盘 中 的 存储 方式 ， 都 要 求 对 相关 的 应 用 程序 进行 实 
际 的 修改 。 相 反 ，DBMS 将 数据 描述 从 应 用 程序 中 分 离 出 来 ， 从 而 使 应 用 程序 不 再 受 数 据 描 
述 改 变 的 影响 。 这 就 是 众所周知 的 数据 独立 性 ，2.1.5 节 将 进一步 讨论 它 。 数 据 独 立 性 简化 
了 数据 库 应 用 程序 的 维护 。 

提高 的 并 发 性 。 在 某 些 基于 文件 的 系统 中 ， 如 果 人 允许 两 个 或 多 个 用 户 同时 访问 文件 ， 那 
么 这 些 访问 可 能 会 互相 影响 ， 导 致 信息 的 丢失 ， 甚 至 破坏 完整 性 。 但 许多 DBMS 能 管理 并 
发 的 数据 库 访 问 ， 确 保 这 样 的 问题 不 会 发 生 。 我 们 将 在 第 22 章 讨论 并 发 控制 。 

增强 的 备份 和 恢复 服务 。 在 许多 基于 文件 的 系统 中 ， 将 保护 计算 机 系统 或 应 用 程序 不 受 
故障 影响 的 任务 推 给 用 户 。 这 可 能 需要 时 常 对 数据 进行 备份 。 如 果 发 生 了 数据 故障 ， 前 一 天 
备份 的 数据 将 被 恢复 ， 当 然 备 份 之 后 所 进行 的 所 有 工作 将 全 部 丢失 ， 不 得 不 重新 再 来 一 过 。 
相反 ， 现 代 的 DBMS 提供 了 便利 的 方法 ， 将 发 生 故障 后 的 数据 gy DBMS 的 缺点 
丢失 率 降低 到 最 低 限度 。22.3 节 将 讨论 数据 库 恢 复 问 题 。 “Sane ani 
缺点 规模 大 

数据 库 方法 的 缺点 在 表 1-3 中 列 出 。 DBMS 的 费用 高 

复杂 性 高 。 人 们 期 望 DBMS 提供 各 种 各 样 的 功能 ， 这 使 得 。 ”需要 附加 的 硬件 费用 
DBMS 变 为 一 个 相当 复杂 的 软件 。 数 据 库 设计 人 员 、 应 用 开发 。 ”区 化 费用 大 
者 、 数 据 和 数据 库 管理 员 以 及 终端 用 户 必须 对 这 些 功 能 了 解 透 eee i 
彻 才能 很 好 地 利用 它 。 反 之 ， 将 会 导致 错误 的 设计 决策 ， 对 组 
织 机 构 产 生 很 严重 的 后 果 。 

规模 大 。 复 杂 性 和 功能 的 多 样 性 使 得 DBMS 体积 很 大 ， 占 用 大 量 的 磁盘 存储 空间 ， 并 
且 需 要 大 量 的 内 存 空间 才能 高 效 运行 。 

DBMS 的 费用 高 。DBMS 的 费用 依 所 提供 的 环境 和 功能 的 不 同 而 有 很 大 的 差异 。 例 如 ， 
一 台 个 人 计算 机 上 的 单 用 户 DBMS 可 能 只 需 花 费 100 美元 。 然 而 ， 为 上 百 位 用 户 提供 服务 
的 大 型 多 用 户 DBMS 就 会 十 分 昂贵 ， 可 能 需要 10 万 美元 ， 甚 至 100 万 美元 。 每 年 还 需要 周 
期 性 的 维护 费用 ， 通 常 为 售 价 的 一 定 比例 。 

需要 附加 的 硬件 费用 。 为 存储 DBMS 和 数据 库 通 常 需要 购买 额外 的 存储 空间 。 进 而 ， 
为 了 达到 预期 的 性 能 要 求 ， 必 要 时 还 需要 购买 一 台大 型 机 ， 其 至 是 一 台 专 门 用 于 运行 DBMS 
的 机 器 。 购 置 附加 硬件 导致 了 系统 费用 的 进一步 增加 。 

转化 费用 大 。 在 某 些 情况 下 ， 比 起 将 已 存在 的 应 用 转换 为 可 在 新 的 DBMS 和 硬件 上 运 
行 的 应 用 ， 购 买 新 的 DBMS 及 附加 硬件 的 费用 要 小 得 多 。 这 类 费用 也 包括 培训 员工 使 用 新 
系统 的 费用 ， 可 能 还 包括 聘请 专业 人 员 帮 助 完成 系统 转换 和 运行 的 费用 。 正 是 因为 这 笔 费 用 
巨大 ,一 些 组 织 虽然 对 他 们 在 用 的 系统 不 满意 ， 也 不 转 而 使 用 更 加 现代 化 的 数据 库 技术 。 术 
语 遗 留 系统 有 时 候 用 来 指 旧 的 、 通 常 较 劣 等 的 系统 。 

性 能 相对 较 低 。 基 于 文件 的 系统 通常 是 专 为 一 个 特定 的 应 用 开发 的 ， 例 如 发 货 业 务 ， 性 
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能 一 般 较 好 。 然 而 ，DBMS 更 加 通用 ， 需 满足 许多 应 用 而 不 是 仅仅 一 个 应 用 的 需求 。 结 果 导 
致 某 些 应 用 不 能 像 从 前 那样 快速 运行 。 


故障 带 来 的 影响 较 大 。 资 源 集中 管理 增加 了 系统 的 脆弱 性 。 由 于 所 有 的 用 户 和 应 用 都 依 


Hi T DBMS 的 可 用 性 ， 因 此 任何 一 个 组 成 部 分 的 故障 都 可 能 导致 运行 停止 。 


本 章 小 结 


目前 数据 库 管 理 系统 ( DBMS) 已 成 为 信息 系统 的 基本 框架 ， 从 根本 上 改变 了 许多 组 织 机 构 的 运作 
方式 。 数 据 库 系 统 仍然 是 一 个 相当 活跃 的 研究 领域 ， 还 存在 许多 重大 的 问题 有 待 解 决 。 

DBMS 的 前 身 是 基于 文件 的 系统 ， 这 是 一 组 为 终端 用 户 提供 服务 的 应 用 程序 ， 通 第 会 产生 许多 报 
表 。 每 个 程序 定义 和 管理 自己 的 数据 。 尽 管 基于 文件 的 系统 相对 于 人 工 管理 是 一 大 进步 ， 但 还 存在 
数据 元 余 、 程 序 - 数据 高 度 依赖 等 重大 问题 。 

数据 库 方 法 的 出 现 是 为 了 解决 基于 文件 的 方法 存在 的 弊病 。 数 据 库 是 为 满足 某 个 组 织 机 构 的 信息 要 
求 而 设计 一 组 共享 的 、 逻 辑 上 相关 的 数据 及 数据 的 描述 。DBMS 是 一 个 软件 系统 ， 它 支持 用 户 对 数 
据 库 进行 定义 、 创 建 、 维 护 以 及 控制 访问 。 应 用 程序 是 通过 向 DBMS 提出 合适 请 求 (通常 是 一 个 
SQL 语句 ) 而 与 数据 库 交 互 作用 的 计算 机 程序 。 我 们 用 更 概括 的 术语 数据 库 系 统 指 代 由 与 数据 库 交 
互 作用 的 应 用 程序 、DBMS 和 数据 库 本 身 一 起 构成 的 整体 。 

所 有 对 数据 库 的 访问 都 须 通 过 DBMS 进行 。DBMS 提供 了 支持 用 户 定 义 数据 库 的 数据 定义 语言 
(DDL)， 以 及 支持 用 户 插入 、 更 新 、 删 除 及 检索 数据 的 数据 操作 语言 (DML), 

DBMS 提供 对 数据 库 的 受 控 访问 。 它 提供 了 安全 、 完 整 、 并 发 和 恢复 控制 ， 以 及 用 户 可 访问 目录 。 
它 还 提供 视图 机 制 ， 以 简化 用 户 必须 处 理 的 数据 。 

DBMS 环境 包括 硬件 (计算 机 )、 软 件 (DBMS、 操 作 系 统 和 应 用 程序 )、 数 据 、 规 程 和 人 。 人 包括 
数据 管理 员 和 数据 库 管理 员 、 数 据 库 设 计 人 员 、 应 用 开发 人 员 和 终端 用 户 。 

DBMS 源 于 基于 文件 的 系统 。 层 次 和 CODASYL 系统 代表 了 第 一 代 DBMS。 层 次 模型 的 代表 
JE IMS (信息 管理 系统 )， 网 状 或 CODASYL 模型 的 代表 是 IDS (综合 数据 存储 器 )， 这 两 者 都 是 
在 20 世纪 60 年 代 发 展 起 来 的 。1970 年 ， 由 E. F. Codd 提出 的 关系 模型 代表 了 第 二 代 DBMS。 € 
对 DBMS 产生 了 深远 的 影响 ， 现 在 已 经 有 了 100 多 种 关系 DBMS。 第 三 代 DBMS 是 以 对 象 关 系 
DBMS 和 面向 对 象 DBMS 为 代表 的 。 

数据 库 方法 的 优点 包括 受 控 的 数据 元 余 、 数 据 一 致 性 、 数 据 共 享 ， 以 及 增强 的 安全 性 和 完整 性 。 数 
据 库 方法 的 缺点 包括 复杂 性 高 、 昂 贵 、 性 能 降低 和 故障 影响 较 大 等 。 


思考 题 


1.1 


除了 在 1.1 节 列 出 的 数据 库 系统 外 ， 再 列 出 四 个 数据 库 系 统 的 例子 。 


1.2 讨论 下 列 术 语 : 


(a) 数据 

(b) 数据 库 

(c) 数据 库 管理 系统 
(d) 数据 库 应 用 程序 
(e) 数据 独立 性 

(f) 安全 性 

(g) 完整 性 
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(h) 视图 
1.3 描述 早期 的 基于 文件 的 系统 处 理 数 据 的 方法 。 讨 论 这 种 方法 的 缺点 。 
1.4 ”描述 数据 库 方 法 的 主要 特性 ， 并 与 基于 文件 的 方法 进行 比较 。 
1.5 HHE DBMS 环境 的 五 个 组 成 部 分 ， 并 讨论 它们 之 间 的 相互 关系 。 
1.6 讨论 下 列 人 员 在 数据 库 环境 中 的 作用 : 

(a) 数据 管理 员 

(b) 数据 库 管理 员 

(c) 逻辑 数据 库 设 计 人 员 

(d) 物理 数据 库 设 计 人 员 

(e) 应 用 开发 人 员 

(f) 终端 用 户 
1.7 讨论 三 代 DBMS. 
1.8 讨论 DBMS 的 优 缺 点 。 


习题 
1.9 ”采访 一 些 数据 库 系 统 的 用 户 ， 了 解 他 们 认为 DBMS 的 哪 一 个 特性 最 有 用 ， 哪 一 个 功能 最 没 用 ， 
为 什么 ? 这 些 用 户 认 为 DBMS 有 哪些 优点 和 缺点 ? 
1.10 ”编写 一 个 小 程序 (必要 时 可 使 用 伪 码 ) 用 于 录入 和 显示 客户 的 详细 信息 ， 包 插 客户 编号 、 名 字 、 
地 址 、 电 话 号 码 、 首 选 的 房间 数量 以 及 所 能 接受 的 最 高 租金 。 这 些 信息 应 该 被 组 织 到 一 个 文件 
中 。 录 入 几 个 记录 并 显示 出 来 。 现 在 重复 这 项 工作 ， 不 过 不 再 写 专门 的 程序 ， 而 是 使 用 你 能 访 
问 到 的 任 一 DBMS。 你 能 从 这 两 种 方法 总 结 出 什么 ? 
1.11 研究 11.4 节 和 附录 A 中 的 DreamHome 案例 。 
(a) DBMS 可 以 为 这 个 组 织 机 构 提 供 哪些 便利 ? 
(b) 你 发 现 哪些 数据 需要 在 数据 库 中 表示 ? 
(c) 数据 项 之 间 存 在 什么 关系 ? 
(d) 针对 每 一 种 对 象 ， 你 认为 哪些 细节 应 存储 在 数据 库 中 ? 
(e) 你 认为 需要 哪些 查询 ? 
1.12 ”研究 附录 B.3 中 的 Wellmeadows Hospital 案例 。 
(a) DBMS 可 以 为 这 个 组 织 机 构 提 供 哪些 便利 ? 
(b) 你 发 现 哪些 数据 需要 在 数据 库 中 表示 ? 
(c) 数据 项 之 间 存 在 什么 关系 ? 
(d) 针对 每 一 种 对 象 ， 你 认为 哪些 细节 应 存储 在 数据 库 中 ? 
(e) 你 认为 需要 哪些 查询 ? 
1.13 ”请 分 别 给 出 DreamHome 之 类 的 公司 使 用 DBMS 的 三 条 优点 和 三 条 缺点 ， 要 求 说 明理 由 。 
1.14 请 浏览 下 列 网 页 并 发 现 有 价值 的 信息 : 
(a) http://www.oracle.com 
(b) http://www.microsoft.com/sql 和 http://www.microsoft.com/access 
(c) http://www.ibm.com/db2 
(d) http://www.mysql.com 
(e) http://en.wikipedia.org/wiki/database 和 http://en.wikipedia.org/wiki/DBMS 


扩展 阅读 


网 络 资源 


http://en.wikipedia.org/wiki/Database Wikipedia 
entry for databases. 

http://en.wikipedia.org/wiki/ DBMS Wikipedia 
entry for DBMSs. 

http://databases.about.com Web portal contain- 
ing articles about a variety of database issues. 

http://searchdatabase.techtarget.com/ Web portal 
containing links to a variety of database issues. 

http://www.ddj.com Dr Dobbs journal. 

http://www.intelligententerprise.com Intelligent 
Enterprise magazine, a leading publication on 
database management and related areas. This 
magazine is the result of combining two 
previous publications: Database Programming, 
and Design and DBMS. 
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http://www.techrepublic.com A portal site for 
information technology professionals that can 
be customized to your own particular interests. 

http://www.webopedia.com An online diction- 
ary and search engine for computer terms and 
Internet technology. 

http://www.zdnet.com Another portal site contain- 
ing articles covering a broad range of IT topics. 

Useful newsgroups are: 

comp.client-server 

comp.databases 

comp.databases.ms-access 

comp.databases.ms-sqlserver 

comp.databases.olap 

comp.databases.oracle 

comp.databases.theory 
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数据 库 环境 





| 本 章 目标 

本 章 我 们 主要 学 习 : 

o 数据 库 三 层 体 系 结构 的 用 途 和 起源 
外 部 层 、 概 念 层 和 内 部 层 的 主要 内 容 
外 部 层 到 概念 层 及 概念 层 到 内 部 层 映射 的 用 途 
雇 辑 数据 独立 性 和 物理 数据 独立 性 的 含义 
数据 定义 语言 (DDL) 和 数据 操作 语言 (DML) 的 差别 
数据 模型 的 分 类 
概念 建 模 的 目的 和 重要 性 
DBMS 应 该 提供 的 基本 功能 和 服务 
o 系统 目录 的 作用 和 重要 性 


数据 库 系统 的 一 个 主要 目的 就 是 为 用 户 提 供 数 据 的 抽象 视图 ， 而 隐藏 数据 存储 和 操作 的 
细节 。 因 此 ， 设 计 一 个 数据 库 的 起 点 应 该 是 某 个 组 织 机 构 将 要 存储 到 数据 库 中 的 信息 的 概要 
和 一 般 描述 。 注 意 ， 在 本 章 及 本 书 中 ， 常 用 术语 “组 织 机 构 ” 来 指 一 个 单位 或 其 某 个 部 门 。 
例如 ， 在 DreamHome 案例 中 ， 我 们 可 能 只 感 兴趣 于 建 模 : 

e 现实 世界 的 实体 员工 (Staff) HEr (PropertyforRent)、 业 主 (PrivateOwner) 和 

客户 〈Client )。 

e 描述 每 个 实体 的 性 质 的 属性 (例如 ， 员 工具 有 属性 姓名 (name)、 职 务 ( position) 和 

工资 (salary) )。 

e 实体 之 间 的 联系 (例如 ， 员 工 管理 (Manages) 租 售 房产 )。 

此 外 ， 由 于 数据 库 是 一 种 共享 的 资源 ， 所 以 不 同 用 户 可 能 需要 数据 库 中 数据 的 不 同 视 
图 。 为 了 满足 这 些 需要 ， 现 在 几乎 所 有 的 商业 DBMS 都 在 某 种 程度 上 基于 所 谓 的 ANSI- 
SPARC 体系 结构 。 本 章 将 讨论 DBMS 的 各 种 体系 结构 和 功能 特性 。 


| 本 章 结构 

2.1 节 研 究 ANSI-SPARC 三 层 体系 结构 及 其 优点 。2.2 节 讨 论 DBMS 所 使 用 的 各 类 语言 。 
2.3 节 介 绍 数据 模型 及 概念 建 模 的 有 关 概 念 ， 这 些 概 念 在 后 续 章 节 还 将 深入 讨论 。2.4 节 给 出 
期 望 DBMS 提供 的 功能 。 本 章 的 例子 取 自 DreamHome 案例 ， 这 个 案例 将 在 11.4 节 和 附录 
A 中 详细 讨论 。 

本 章 的 许多 材料 有 关 DBMS 的 重要 背景 信息 。 然 而 ， 对 数据 库 系 统领 域 不 熟 的 读者 可 
能 会 发 现 有 一 些 材料 在 初次 阅读 时 很 难 理解 。 不 用 太 纠 结 ， 阅 读 了 本 书 的 大 部 分 章节 后 可 重 
读本 章 的 这 些 内 容 。 
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2.1 ANSI-SPARC 三 层 体 系 结构 


早 在 1971 年 ， 由 数据 系统 语言 会 议 (CODASYL，1971 ) 任命 的 数据 库 任务 组 (DBTG) 
就 提出 了 关于 数据 库 系统 的 标准 术语 和 一 般 体系 结构 规范 。DBTG 认为 系统 需要 两 层 结 构 ， 
即 从 系统 角度 看 的 模式 (schema) 和 从 用 户 角度 看 的 子 模式 ( subschema)。1975 年 ， 美 国 国 
家 标准 化 协会 (ANSI) 标准 规划 和 需求 委员 会 ( SPARC) 也 提出 了 一 套 类 似 的 术语 和 体系 结 
构 ， 即 ANSI/X3/SPARC (ANSI, 1975). ANSI-SPARC 提出 的 是 带 系统 目录 的 三 层 结构 体 
系 。 这 些 提案 都 体现 了 IBM 的 “指南 和 共享 ”用 户 组 织 早先 发 表 的 一 些 建议 ， 并 且 集 中 表 
现 为 需要 设立 一 个 独立 于 实现 的 层次 ， 用 于 将 程序 与 基本 的 表示 问题 分 离开 ( Guide/Share, 
1970 ) 。 尽 管 ANSI-SPARC 模型 最 终 没 有 成 为 标准 ， 但 它 仍 然 是 理解 DBMS 某 些 功 能 的 
基础 。 

为 此 ， 在 这 些 及 以 后 的 报告 中 ， 一 个 基本 观点 就 是 区 分 三 层 抽象 ， 即 描述 数据 的 三 个 不 
同 层次 。 这 样 形成 了 一 个 三 层 体 系 结构 ， 包 括 外 部 层 、 概 念 层 和 内 部 层 ， 如 图 2-1 所 示 。 用 户 
从 外 部 层 观察 数据 ，DBMS 和 操作 系统 从 内 部 层 观察 数据 。 在 内 部 层 ， 数 据 实际 上 是 使 用 附 
录 下 描述 的 数据 结构 和 文件 组 织 方法 存储 的 。 概 念 层 提 供 内 、 外 部 层 的 映射 和 必要 的 独立 性 。 


外 部 层 


概念 层 


内 部 层 


物理 数 
据 组 织 





图 2-1 -ANSI-SPARC 三 层 体系 结构 


三 层 体 系 结构 的 目的 是 将 用 户 的 数据 库 视图 与 数据 库 的 物理 描述 分 离开 。 如 此 分 离 的 原 
因 可 概括 为 : 

。 每 个 用 户 都 能 访问 相同 的 数据 ， 但 可 用 各 上 自 定制 的 数据 视图 。 每 个 用 户 都 应 该 能 够 
改变 自己 的 数据 视图 ， 但 这 些 改 变 不 会 影响 其 他 用 户 。 

e 不 要 求 用 户 直 接 处 理 数据 库 物 理 存储 的 细节 ， 例 如 索引 或 散 列 ( 见 附录 FF)。 换 名 话 
说 ， 用 户 与 数据 库 的 交互 应 该 独立 于 存储 细节 。 

e 数据 库 管理 员 (DBA) 能 在 不 影响 用 户 视图 的 情况 下 修改 数据 库存 储 结构 。 

© 数据 库 的 内 部 结构 不 受 存储 的 物理 变化 的 影响 ,例如 将 数据 转 存 到 茶 个 新 的 存储 设 
备 上 。 

© DBA 能 在 不 影响 所 有 用 户 的 情况 下 修改 数据 库 的 概念 结构 。 


28 H—-BD F x 


2.1.1 外 部 层 
| 外 部 层 | 数据 库 的 用 户 视图 。 这 一 层 描述 与 每 一 个 用 户 相关 的 数据 库 部 分 。 


外 部 层 由 数据 库 的 若干 不 同 视 图 组 成 。 每 个 用 户 都 有 自己 的 视图 ， 该 视图 用 其 熟悉 的 方 
式 表 示 “ 现 实 世界 ”。 外 部 视图 仅仅 包含 “现实 世界 ”中 用 户 感 兴趣 的 那些 实体 、 属 性 及 
联系 。 男 外 一 些 不 感 兴 趣 的 实体 、 属 性 或 者 联系 也 可 能 存在 于 数据 库 中 ,但 是 用 户 不 必 知 晓 。 

并 且 ， 对 于 同一 个 数据 ， 不 同 的 视图 可 能 会 有 不 同 的 表达 方式 。 例 如 ， 一些 用 户 可 能 是 
以 日 、 月 、 年 的 形式 查看 日 期 ， 而 男 外 一 些 用 户 可 能 是 以 年 、 月 、 日 的 形式 查看 日 期 。 一 些 
视图 可 能 包含 导出 的 或 者 通过 计算 得 出 的 数据 ， 即 数据 实际 上 并 没有 真实 存储 到 数据 库 中 ， 
而 是 当 需 要 的 时 候 才 产生 。 例 如 ， 在 DreamHome 案例 中 ， 可 能 需要 查看 一 名 员工 的 年 龄 。 
但 是 年 龄 可 能 不 会 被 存储 起 来 ， 因 为 这 个 数据 可 能 需要 经 常 更 改 。 但 是 ， 可 以 存储 员工 的 出 
生日 期 ， 当 需要 查看 年 龄 的 时 候 ， 可 以 由 DBMS 计算 出 来 。 视 图 甚至 可 以 包含 由 多 个 实体 
组 合 或 者 导出 的 数据 。 本 书 的 4.4 节 和 7.4 节 将 更 加 详细 地 讨论 视图 。 


2.1.2 概念 层 


概念 层 © 数据库 的 整体 视图 。 这 一 层 描 述 了 哪些 数据 被 存储 在 数据 库 中 ， 以 及 这 些 数据 之 
间 的 联系 。 


三 层 体 系 结构 中 间 的 一 层 就 是 概念 层 。 这 一 层 包含 DBA 所 看 到 的 整个 数据 库 的 逻辑 结 
构 。 它 是 组 织 机 构 关 于 数据 需求 的 完整 视图 ， 但 完全 独立 于 存储 考虑 。 概 念 层 描述 : 

© 所 有 的 实体 、 实 体 的 属性 和 实体 间 的 联系 。 

© 数据 的 约束 。 

o 数据 的 语义 信息 。 

e 安全 性 和 完整 性 信息 。 

概念 层 文 持 每 一 个 外 部 视图 ， 凡 是 用 户 可 访问 的 数据 必定 包含 在 概念 层 或 者 由 概念 层 
数据 可 导出 。 但 是 这 层 不 包括 任何 依赖 于 存储 的 细节 。 例 如 ， 对 于 实体 的 描述 只 包括 属性 的 
数据 类 型 (例如 ， 整 型 、 实 型 或 字符 型 )， 以 及 它们 的 长 度 (例如 ， 数 字 或 字符 的 最 大 位 数 )， 
但 是 不 包括 任何 与 存储 相关 的 信息 ， 例 如 实际 所 占用 的 字 节 数 。 


2.1.3 AME 


| AWE | 数据 库 在 计算 机 上 的 物理 表示 。 这 一 层 描述 数据 是 如 何 存储 在 数据 库 中 的 。 


内 部 层 包 括 为 了 得 到 数据 库 运 行 时 的 最 佳 性 能 而 采用 的 物理 实现 方法 ,包括 在 存储 设 
备 上 存储 数据 所 采用 的 数据 结构 和 文件 组 织 方法 。 它 通过 与 操作 系统 的 访问 方法 (存储 和 检 
索 数 据 记录 的 文件 管理 技术 ) 交互 ， 完 成 在 存储 设备 上 存放 数据 、 建 立 索 引 和 检索 数据 等 操 
作 。 内 部 层 与 如 下 工作 相关 : 

© 数据 和 索引 的 存储 空间 分 配 。 

© 用 于 存储 的 记录 描述 (数据 项 的 存储 大 小 )。 

e 记录 放置 。 

© 数据 压缩 和 数据 加 密 技 术 。 

内 部 层 之 下 的 是 物理 层 ， 物 理 层 可 能 在 DBMS 的 指导 下 受 操 作 系统 的 控制 。 然 而 ， 
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DBMS 和 操作 系统 在 物理 层 上 的 功能 分 割 并 不 是 十 分 清晰 ， 并 且 因 系统 而 异 。 一 些 DBMS 
充分 利用 操作 系统 的 访问 方法 ， 而 另外 一 些 只 使 用 一 些 最 基本 的 功能 ， 然 后 创建 它们 自己 的 
文件 组 织 机 制 。 处 于 DBMS 之 下 的 物理 层 所 包含 的 内 容 只 有 操作 系统 和 掌握。 例如， 序列 是 
如 何 精 确实 现 的 ， 内 部 记录 域 在 磁盘 上 是 否 存储 为 连续 的 字 节 ， 等 等 。 


2.1.4 模式、 映射 和 实例 


对 数据 库 的 整体 描述 称 为 数据 库 模式 。 在 数据 库 中 存在 三 种 不 同类 型 的 模式 ， 这 三 类 模 
式 正 是 根据 图 2-1 所 描述 的 三 层 结构 所 示 的 三 个 抽象 层次 来 定义 的 。 在 最 高 层 ， 有 若干 外 部 
模式 (也 称 为 子 模式 )， 与 不 同 的 数据 视图 相对 应 。 在 概念 屋 ， 有 概念 模式 ， 它 描述 所 有 的 
实体 、 属 性 和 联系 及 其 上 的 完整 性 约束 。 在 抽象 的 最 低层 ， 有 内 部 模式 ， 是 内 部 模型 的 完整 
描述 ， 包 括 存 储 记 录 的 定义 、 表 示 方 法 、 数 据 域 ， 必 要 时 还 有 所 使 用 的 索引 和 散 列 方案 。 一 
个 数据 库 只 有 一 个 概念 模式 和 一 个 内 部 模式 。 

DBMS 负责 这 三 类 模式 之 间 的 映射 。 它 必须 检查 模式 以 确保 一 致 性 ， 换 名 话说 ，DBMS 
必须 检查 每 个 外 部 模式 能 否 由 概念 模式 导出 ， 并 使 用 概念 模式 中 的 信息 ， 完 成 内 、 外 模式 的 
上 映射。 概念 模 式 通 过 概念 层 到 内 部 层 的 映射 与 内 部 模式 相 联 系 。 这 样 ，DBMS 就 能 在 物理 存 
储 中 找 出 构成 概念 模式 中 逻辑 记录 的 实际 记录 或 记录 集 ， 以 及 对 逻辑 记录 进行 操作 过 程 中 应 
遵守 的 约束 。 一 般 允 许 两 类 模式 在 实体 名 称 、 属 性 名 称 、 属 性 顺序 、 数 据 类 型 等 方面 存在 不 
同 。 最 后 ， 每 一 个 外 部 模式 通过 外 部 层 到 概念 层 的 映射 与 概念 模式 相 联系 。 这 就 允许 DBMS 
将 用 户 视图 中 的 名 称 映 射 到 概念 模式 中 相应 的 部 分 。 

图 2-2 给 出 了 一 个 不 同 层 的 例子 。 存 在 两 个 不 同 的 关于 员工 详细 信息 的 外 部 视图 : 一 个 
包含 员工 编号 (SNo)、 名 字 (fName), ERG (IName)、 年 龄 (age) 和 工资 (salary) ; 另外 一 
个 包含 员工 编号 (staffNo)、 姓 氏 (IName)， 以 及 这 个 员工 所 工作 的 部 门 编号 (branchNo ) 。 
这 些 外 部 视图 归并 为 一 个 概念 视图 。 此 归并 的 主要 不 同 之 处 是 将 age 字段 改 为 DOB (出 生日 
期 ) FEto DBMS 维护 外 部 层 到 概念 层 映 射 。 例 如 ， 它 将 第 一 个 外 部 视图 中 的 sNo 字段 映射 
成 概念 层 记 录 中 的 staffNo 字段 。 概 念 层 则 被 映射 到 内 部 层 ， 在 内 部 层 中 包含 对 于 概念 记录 
结构 的 一 个 物理 描述 。 在 这 一 层 ， 可 看 到 一 个 用 高 级 语言 定义 的 结构 。 这 个 结构 包含 一 个 指 
针 一 一 next， 员 工 记 录 靠 这 个 指针 在 物理 上 连接 成 一 条 链 。 注 意 ， 在 内 部 层 ， 数 据 域 的 顺序 
与 概念 层 不 同 。 而 且 ，DBMS 还 要 维护 概念 层 到 内 部 层 的 映射 。 





struct STAFF { 
int staffNo; 
int branchNo; 
char fName [15]; 


char IName [15]; 
内 部 层 struct date dateOf Birth; 
float salary; 
struct STAFF *next; /* 指向 下 一 个 Staff 记 录 的 指针 / 
y 
index staffNo; index branchNo; * Æ X Staff E HF 5 


图 2-2 三 个 层次 的 不 同 之 处 
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区 分 数据 库 的 描述 和 数据 库 本 身 是 很 重要 的 。 数 据 库 的 描述 是 数据 库 模 式 。 这 个 模式 
是 在 数据 库 设 计 过 程 中 指定 的 ， 并 且 不 会 经 常 改变 。 然 而 ， 数 据 库 中 的 实际 数据 可 以 经 常 改 
变 。 例 如 ， 每 次 插入 一 个 新 员工 或 者 一 个 新 的 房产 信息 时 ， 它 都 会 发 生 改 变 。 在 任 一 时 间 点 
上 ， 数 据 库 中 的 数据 构成 一 个 数据 库 实例 。 因 此 ， 许 多 数据 库 实 例 可 以 与 相同 的 数据 库 模式 
相对 应 。 模 式 有 时 候 称 为 数据 库 的 内 含 ， 而 实例 称 为 数据 库 的 外 延 (或 者 状态 )。 


2.1.5 ”数据 独立 性 


三 层 体系 结构 的 一 个 主要 目的 是 保证 数据 独立 性 ， 这 意味 着 对 较 低层 的 修改 不 会 对 较 高 
层 造成 影响 。 有 两 种 类 型 的 数据 独立 性 : 逻辑 数据 独立 性 和 物理 数据 独立 性 。 


| 逻辑 数据 独立 性 | 逻辑 数据 独立 性 指 的 是 外 部 模式 不 受 概念 模式 变化 的 影响 。 


对 概念 模式 的 修改 ， 例 如 添加 或 删除 实体 、 属 性 或 者 联系 ， 应 该 不 影响 已 存在 的 外 部 模 
式 ， 也 不 需要 重新 编写 应 用 程序 。 显 然 ， 重 要 的 是 修改 只 Sarna 其 他 的 
用 户 不 必 知 道 。 


| 物理 数据 独立 性 | 物理 数据 独立 性 指 的 是 概念 模式 不 受 内 部 模式 变化 的 影响 。 


对 内 部 模式 的 修改 ， 例 如 使 用 不 同 的 文件 组 织 方式 或 存储 结构 、 使 用 不 同 的 存储 设备 、 
修改 索引 或 散 列 算法 ， 应 该 不 影响 概念 模式 和 外 部 模式 。 从 用 户 的 观点 来 看 ， 唯 一 需要 注意 
的 是 对 性 能 的 影响 。 实 际 上 ， 人 性 能 变 坏 是 改变 内 部 模式 最 常见 的 原因 。 图 2-3 说 明了 相对 于 
三 层 体系 结构 ， 每 一 类 型 数据 独立 性 出 现 的 位 置 。 


外 部 层 到 逻辑 数据 独立 性 
概念 层 的 
映射 






概念 层 到 
内 部 层 的 
映射 


物理 数据 独立 性 


图 2-3 数据 独立 性 和 ANSI-SPARC 三 层 体系 结构 


ANSI-SPARC 体系 结构 中 的 两 段 映 射 可 能 降低 效率 ， 但 却 能 提供 更 强 的 数据 独立 性 。 然 
而 ， 为 了 更 加 高 效 地 进行 映射 ，ANSI-SPARC 模型 允许 外 部 模式 直接 映射 到 内 部 模式 ， 从 而 
忽略 概念 模式 。 当 然 ， 这 样 做 将 降低 数据 的 独立 性 ， 致 使 当 内 部 模式 发 生 改 变 时 ， 外 部 模式 
及 任何 相关 的 应 用 程序 都 不 得 不 进行 变化 。 


2.2 数据库 语 言 


数据 库 语 言 包 括 两 个 部 分 : 数据 定义 语言 (Data Definition Language, DDL) 和 数据 
操作 语言 ( Data Manipulation Language, DML). DDL 用 来 说 明 数 据 库 模式 ，DML 用 来 读 
取 和 更 新 数据 库 。 这 些 语言 称 为 数据 子 语言 ， 因 为 它们 不 包括 所 有 计算 所 需 的 成 分 ， 例 如 
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一 般 高 级 程序 语言 提供 的 条 件 和 循环 语句 。 许 多 DBMS 支持 将 子 语言 谈 入 高 级 语言 ， 例 如 
COBOL, FORTRAN, Pascal, Ada, C, C++, C#, Java 或 Visual Basic。 此 时 ， 高 级 语言 
称 为 宿主 语言 。 编 译 带 舱 入 语句 的 源 程 序 文件 时 ， 首 先 从 源 程序 中 析出 数据 子 语 言语 句 ， 将 
其 用 也 数 调用 代替 。 然 后 将 该 预 处 理 过 的 文件 编译 为 目标 模块 ， 并 与 包含 预 处 理 时 引入 的 蔡 
REAJI EH DBMS 库 链 接 ， 即 得 到 可 运行 的 目标 程序 。 大 多 数 子 语言 还 提供 非 嵌入 或 者 
交互 式 的 命令 ， 这 些 命令 可 以 直接 从 终端 输入 工作 。 


2.2.1 数据 定义 语言 (DDL) 


DDL | 一 种 供 DBA 或 用 户 描 述 和 命名 应 用 所 需 实体 、 属 性 和 联系 及 其 相关 的 完整 性 约束 和 
安全 约 来 的 语言 。 


数据 库 模 式 是 用 数据 定义 语言 表达 的 一 组 定义 。DDL 可 用 于 定义 模式 或 修改 已 存在 的 
模式 ， 但 不 能 用 来 操作 数据 。 

DDL 语句 的 编译 结果 是 一 组 表格 ， 存 储 在 称 为 系统 目录 的 特殊 文件 中 。 系 统 目录 集中 
存储 元 数据 ， 元 数据 是 一 种 描述 数据 库 中 对 象 的 数据 ， 它 使 访问 和 操作 这 些 对 象 变 得 相对 
容易 。 元 数据 包含 记录 、 数 据 项 ， 以 及 其 他 所 有 用 户 感 兴趣 或 DBMS 要 求 的 对 象 的 定义 。 
DBMS 在 实际 访问 数据 库 的 数据 之 前 ， 通 常 要 查阅 系统 目录 。 尽 管 术语 “数据 字典 ”通常 用 
来 指 代 比 DBMS 的 目录 更 一 般 的 软件 系统 ， 但 人 们 还 是 常用 数据 字典 和 数据 目录 指 代 系统 
目录 。2.4 节 将 进一步 讨论 系统 目录 。 

理论 上 ， 可 以 区 分 用 于 三 层 体系 结构 中 每 层 模式 的 DDL， 分 别称 为 外 部 模式 DDL 、 概 
念 模式 DDL 和 内 部 模式 DDL。 实 际 上 只 需 提 供 一 个 足以 说 明 外 部 模式 和 概念 模式 的 DDL。 


2.2.2 ”数据 操作 语言 (DML ) 


| DML | 提供 了 一 组 基本 操作 ， 支 持 对 数据 库 中 存储 数据 进行 各 种 处 理 操作 的 语言 。 


数据 处 理 操作 通常 包括 : 

© 在 数据 库 中 插入 新 的 数据 。 

© 对 数据 库 中 存储 的 数据 进行 修改 。 

© 检索 数据 库 中 的 数据 。 

© 删除 数据 库 中 数据 。 

因此 ，DBMS 的 一 个 主要 功能 是 提供 数据 操作 语言 ， 用 户 可 以 使 用 该 语言 的 语句 表达 各 
种 数据 处 理 要 求 。 数 据 处 理 被 用 在 外 部 层 、 概 念 层 和 内 部 层 。 然 而 ， 在 内 部 层 ， 必 须 定 义 更 
复杂 的 低级 程序 ， 以 便 进行 高 效 的 数据 访问 。 相 反 ， 在 较 高 层 ， 重 点 放 在 易 用 性 以 及 为 用 户 
提供 高 效 的 系统 界面 上 。 

DML 中 涉及 数据 检索 的 部 分 称 为 查询 语言 。 查 询 语 言 可 被 定义 为 一 个 高 级 的 、 具 有 特 
殊 用 途 的 语言 ， 用 来 满足 对 数据 库 中 的 数据 的 各 种 各 样 的 检索 要 求 。 术 语 “ 查 询 ” 专 门 指 代 
用 查询 语言 表达 的 检索 语句 ， 术 语 “查询 语言 ”与 “DML ”经 常 不 加 区 分 地 引用 ， 尽 管 在 
技术 上 这 是 不 正确 的 。 

区 分 DML 的 标志 是 基本 的 检索 机 制 。 有 两 种 类 型 的 DML : 过 程 化 的 和 非 过 程 化 的 。 
两 者 的 区 别 是 ， 过 程 化 语言 必须 说 明 如 何 得 到 一 个 DML 语句 的 结果 ， 而 非 过 程 化 语言 只 需 


描述 希望 得 到 什么 样 的 输出 。 典 型 的 例子 是 ， 过 程 化 语言 单个 处 理 记 录 ， 而 非 过 程 化 语言 
组 处 理 记录 。 


过 程 化 DML 
| 过 程 化 DML | 要 求 用 户 既 告诉 系统 需要 什么 数据 又 说 明 如 何 检索 这 些 数据 的 语言 。 


使 用 过 程 化 DML 时 ， 用 户 或 一 般 的 程序 员 需 描述 需要 什么 数据 以 及 如 何 得 到 它 。 这 意 
味 着 ， 用 户 必须 表达 通过 调用 适当 的 程序 得 到 所 需 信息 的 所 有 数据 访问 操作 。 例 如 ， 某 过 程 
化 DML 检索 一 个 记录 ， 处 理 它 ， 根 据 处 理 结果 检索 下 一 个 记录 并 做 类 似 处 理 ， 等 等 。 这 个 
检索 过 程 一 直 进 行 下 去 ， 直 到 数据 检索 需要 的 所 有 数据 都 被 收集 起 来 为 止 。 一 般 情况 是 将 过 
FEIE DML 和 众人 高 级 编程 语言 ， 借 由 高 级 编程 语言 实现 循环 和 处 理 导 航 逻 辑 的 机 制 。 网 状 和 
层次 数据 库 的 DML 通常 是 过 程 化 的 (参见 2.3 47). 

非 过 程 化 DML 


| 非 过 程 化 DML | 只 要 求 用 户 告诉 系统 需要 哪些 数据 而 不 需 说 明 如 何 检索 它们 的 语言 。 


非 过 程 化 DML 允许 用 单个 检索 或 更 新 语句 描述 所 需 数 据 。 使 用 非 过 程 化 DML 时， 用 
户 描述 需要 什么 数据 ， 而 不 需 描 述 如 何 得 到 这 个 数据 。DBMS 将 DML 语句 翻译 成 一 或 多 个 
过 程 ， 由 它 负 责 对 所 要 求 的 记录 集合 进行 操作 。 这 样 就 避免 了 用 户 必 须知 道 数 据 结构 的 内 部 
实现 以 及 检索 和 转换 数据 所 需 的 算法 ， 从 而 为 用 户 提 供 了 可 观 的 数据 独立 性 。 非 过 程 化 语言 
也 称 为 说 明 性 语言 。 关 系 DBMS 通常 提供 用 于 数据 操作 的 某 种 形式 的 非 过 程 语言 ， 典 型 的 如 
SQL (结构 查询 语言 ) 或 者 QBE (Query-By-Example， 举 例 查 询 )。 非 过 程 化 DML 通常 比 过 
Fett DML 更 容易 学 习 和 使 用 ， 因 为 需 用 户 做 的 工作 少 了 ,DBMS 承担 的 工作 多 了 。 第 6 一 9 
章 和 附录 工 将 详细 讨论 SQL， 附 录 M 将 详细 介绍 QBE。 


2.2.3 ”第 四 代 语 言 

关于 第 四 代 语 言 (4GL) 的 组 成 目前 还 没有 统一 的 认识 ， 它 实际 上 是 一 种 快捷 的 编程 二 
言 。 在 第 三 代 语 言 (3GL， 如 COBOL) 中 需要 几 百 行 表达 的 操作 ， 在 4GL 中 通常 仅仅 需要 
几 行 。 

与 过 程 化 3GL 相 比 ，4GL 一 般 是 非 过 程 化 的 : 用 户 只 需 定 义 做 什么 ， 而 不 需 说 明 怎 么 
做 。4GL 被 认为 在 很 大 程度 上 更 加 依赖 于 较 高 层 的 组 件 ， 称 为 第 四 代 工 具 。 为 执行 一 项 任 
务 ， 用 户 不 用 逐 行 写 程序 ， 而 只 要 为 一 些 工 具 定义 参数 ， 由 它们 即 可 产生 应 用 程序 。4GL 已 
经 被 声称 可 以 成 10 倍 地 提高 生产 效率 ， 当 然 ， 这 是 以 减少 可 处 理 问题 的 种 类 为 代价 的 。 第 
四 代 语 言 包 括 : 

e 表示 语言 ， 例 如 查询 语言 或 者 报表 生成 器 。 

e 特殊 语言 ， 例 如 电子 表格 和 数据 库 语 言 。 

e 文 持 定 义 、 插 和 人 入、 更 新 和 恢复 数据 库 的 应 用 程序 生成 器 。 

e 用 于 生成 应 用 程序 代码 的 甚 高 级 语言 。 

前 面 曾经 提 到 过 的 SQL 和 QBE 是 4GL 的 两 个 例子 。 现 在 简单 地 介绍 一 些 其 他 类 型 的 AGL 
RERA 
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义 屏幕 的 样式 、 欲 显示 的 信息 ， 以 及 在 屏幕 的 显示 位 置 。 可 能 还 允许 定义 屏幕 元 素 的 颜色 及 
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另外 一 些 参数 ， 例 如 粗 体 、 下 划 线 、 闪 烁 、 反 转 显示 等 。 更 好 的 表单 生成 器 还 允许 创建 由 算 
术 运 算 或 聚集 操作 导出 的 属性 ， 以 及 说 明 对 输入 数据 的 有 效 性 检查 。 
报表 生成 大 

报表 生成 器 是 生成 数据 库 中 存储 数据 的 报表 的 工具 。 它 与 查询 语言 类 似 ， 人 允许 用 户 从 数 
据 库 中 检索 数据 用 于 报表 中 。 然 而 ,报表 生 成 融 允 许 用 户 对 输出 的 样式 进行 更 多 的 控制 。 用 
户 既 可 让 报表 生成 器 自动 地 决定 输出 样式 也 可 以 使 用 特殊 的 报表 生成 器 命令 自己 定义 输出 报 
表 的 样式 。 

主要 有 两 种 类 型 的 报表 生成 器 : 面向 语言 的 和 可 视 的 。 前 者 用 子 语言 的 命令 定义 报表 中 
的 数据 和 报表 格式 。 后 者 使 用 一 个 类 似 于 表单 生成 副 的 机 制定 义 同 样 的 信息 。 
图 形 生 成 如 

图 形 生 成 器 是 从 数据 库 中 检索 数据 并 以 图 形 的 形式 显示 数据 的 工具 ， 图 形 化 表示 的 一 般 
是 数据 的 趋势 或 关系 。 通 常 允 许 用 户 创建 柱 图 、 饼 图 、 线 形 图 和 谐 图 等 。 
应 用 程序 生成 右 

应 用 程序 生成 器 是 能 产生 与 数据 库 接口 的 程序 的 工具 。 使 用 应 用 程序 生成 器 可 以 节省 设 
计 整 个 软件 的 时 间 。 应 用 程序 生成 器 通常 包括 若干 预先 写 好 的 模块 ， 它 们 能 构成 大 多 数 应 用 
程序 的 基本 功能 。 这 些 模块 通常 用 高 级 语言 编写 ， 构 成 一 个 可 选择 的 函数 库 。 用 户 描述 程序 
要 做 什么 ， 应 用 程序 生成 怖 决定 如 何 做 。 


2.3 ”数据 模型 和 概念 建 模 


如 前 所 述 ， 模 式 一 般 用 某 种 数据 定义 语言 描述 。 实 际 上 ， 它 一 定 是 用 某 个 具体 的 DBMS 
的 数据 定义 语言 编写 的 。 遗 憾 的 是 ， 这 类 语言 太 低级 ， 用 其 描述 一 个 组 织 机 构 的 数据 需求 不 
易 被 各 类 用 户 广 泛 理解 。 为 此 ， 我 们 需要 更 高 层次 的 模式 描述 ， 也 就 是 数据 模型 。 


数据 模型 | 一 组 集成 的 概念 ， 用 于 描述 和 操纵 组 织 机 构 内 的 数据 、 数 据 间 联系 以 及 对 数据 
的 约束 。 


模型 是 “现实 世界 ”中 对 象 和 事件 及 其 关联 的 表示 。 它 集中 抽象 了 一 个 组 织 机 构 内 本 质 
的 东西 ， 而 忽略 其 非 本 质 特性 。 一 个 数据 模型 刻画 一 个 组 织 。 它 应 该 提供 基本 的 概念 和 表示 
方法 ， 使 得 数据 库 设 计 人 员 和 终端 用 户 能 明白 无 误 地 交流 他 们 对 组 织 内 数据 的 理解 。 数 据 模 
型 含 下 列 三 个 组 件 : 

(1) 结构 部 分 ， 由 一 组 创建 数据 库 的 规则 组 成 。 

(2) 操纵 部 分 ， 定 义 允 许 对 数据 进行 的 操作 的 种 类 (包括 更 新 和 检索 数据 库 中 的 数据 ， 
以 及 修改 数据 库 结构 )。 

(3) 一 组 完整 性 约束 ， 确 保 数据 的 准确 性 。 

数据 模型 的 目的 是 为 了 表示 数据 并 使 数据 容易 理解 。 如 果 做 到 了 这 一 点 ， 它 将 会 很 容易 
地 用 于 设计 数据 库 。 仔 细 考 虑 一 下 2.1 节 中 介绍 的 ANSI-SPARC 体系 结构 ， 可 以 发 现 三 种 相 
互联 系 的 数据 模型 : 

(1) 外 部 数据 模型 ， 表 示 每 一 个 用 户 对 组 织 的 视图 ， 有 时 候 又 称 为 论 域 Universe of 
Discourse, UoD), 


(2) 概念 数据 模型 ， 表 示 独 立 于 DBMS 的 逻辑 (或 者 整体 ) 视图 。 
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(3) 内 部 数据 模型 ， 表 示 能 由 DBMS 理解 的 概念 模式 。 

在 文献 中 曾经 提 到 过 很 多 种 数据 模型 。 可 将 它们 划分 成 三 大 类 : 基于 对 象 的 、 基 于 记 
录 的 和 物理 的 数据 模型 。 前 两 类 用 来 在 概念 层 和 外 部 层 描 述 数据 ， 最 后 一 个 在 内 部 层 描述 
数据 。 


2.3.1 基于 对 象 的 数据 模型 


基于 对 象 的 数据 模型 用 到 实体 、 属 性 和 联系 等 概念 。 实 体 是 组 织 机 构 内 可 区 分 的 对 象 
(比如 人、 地 上 点、 事务、 概念、 事件 )， 它 们 将 在 数据 库 中 描述 。 属 性 是 对 象 的 性 质 ， 它 描述 
对 象 某 个 被 关注 的 方面 。 联 系 是 实体 之 间 的 关联 。 常 见 的 基于 对 象 的 数据 模型 有 : 

e 实体 - 联系 (ER) 模型 

e 语义 模型 

e 图 数 模型 

o 面 问 对 象 模型 

ER 模型 现在 已 演变 为 数据 库 设 计 的 重要 技术 之 一 ， 并 且 作 为 本 书 采 用 的 数据 库 设 计 方 
法 学 的 基础 。 面 向 对 象 的 数据 模型 扩展 了 实体 的 定义 ， 不 仅 包含 描述 对 象 状 态 的 属性 ， 还 包 
含 了 对 象 相 关 的 动作 ， 也 就 是 行为 。 对 象 被 认为 同时 包含 状态 和 行为 。 在 第 12 章 和 第 13 章 
将 深入 研究 ER 模型 ， 在 第 27 ~ 28 章 将 深入 研究 面向 对 象 模型 。27.2.2 节 还 将 讨论 函数 数 
据 模 型 。 


23.2 ”基于 记录 的 数据 模型 


在 基于 记录 的 数据 模型 中 ， 数 据 库 由 若干 不 同类 型 的 固定 格式 记录 组 成 。 每 个 记录 类 型 
有 固定 数量 的 字段 ， 每 个 字段 有 固定 的 长 度 。 基 于 记录 的 逻辑 数据 模型 基本 有 三 类 : 关系 数 
据 模型 、 网 状 数据 模型 和 层次 数据 模型 。 层 次 和 网 状 数据 模型 几乎 比 关 系数 据 模型 早 10 年 
出 现 ， 因 此 它们 与 传统 的 文件 处 理 的 概念 联系 更 紧密 一 点 。 
关系 数据 模型 

关系 数据 模型 基于 数学 上 关系 的 概念 。 在 关系 模型 中 ， 数 据 和 联系 均 以 表格 的 形式 表 
示 ， 每 个 表格 有 若干 具有 唯一 名 称 的 列 。 图 2-4 展示 了 对 应 部 分 DreamHome 案例 的 一 个 关 
系 模 式 实例 ， 表 示 了 分 公司 和 全 体 员 工 的 信息 。 例 如 ， 员 工 John White 是 一 位 工资 为 30 000 
英镑 的 经 理 ， 他 所 工作 的 分 公司 (branchNo) 是 B005， 从 第 一 个 表格 可 以 看 出 ， 这 个 分 公 
司 位 于 伦敦 的 Deer 大 街 22 号 。 一 定 要 注意 ,在 Staff 和 Branch 之 间 存 在 一 个 联系 : 一 个 
分 公司 拥有 多 名 员工 。 然 而 ， 在 这 两 个 表格 之 间 没 有 显 式 的 链接 ， 只 是 发 现 Staff 关系 中 
的 branchNo 属性 与 Branch 关系 中 的 branchNo 属性 相同 ， 这 就 可 以 确定 它们 之 间 存 在 一 
个 联系 。 

关系 数据 模型 要 求 用 户 将 数据 库 只 看 作 表 格 。 然 而 ， 这 种 看 法 只 适用 于 数据 库 的 逻辑 
结构 ， 也 就 是 ANSI-SPARC 体系 结构 中 的 外 部 层 和 概念 层 ， 而 不 适用 于 数据 库 的 物理 结构 ， 
物理 结构 可 以 使 用 多 种 不 同 的 存储 结构 实现 。 在 第 4 章 将 详细 讨论 关系 数据 模型 。 
网 状 数据 模型 

在 网 状 数据 模型 中 ， 数 据 被 表示 成 一 组 记录 ( record)， 联 系 被 表示 成 络 (set), SKA 
模型 相 比 ， 络 能 更 显 式 地 为 联系 建 模 ， 具 体 实现 时 一 般 使 用 指针 。 记 录 被 组 织 成 一 般 的 图 
结构 ， 此 时 记录 是 图 的 节点 (也 称 为 段 ( segment))， 络 是 图 的 边 (edge). Al 2-5 表示 了 与 
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图 2-4 县 有 相同 数据 的 网 状 模 式 的 实例 。 最 流行 的 网 状 DBMS 是 Computer Associates 的 
IDMS/R。 在 本 书 的 网 站 上 CURL 见 前 言 ) 更 详细 地 讨论 了 网 状 数据 模型 。 


22 Deer Rd SW1 4EH 
16 Argyll St | Aberdeen | AB2 3SU 
163 Main St | Glasgow | GI! 9QX 
32 Manse Rd | Bristol BS99 INZ 
56 Clover Dr | London | NW106EU 


Manager 1-Oct-45 

Assistant 10-Nov-60 
Supervisor 24-Mar-58 
Assistant 19-Feb-70 


Manager 3-Jun-40 
Assistant 13-Jun-65 





图 2-5 网 状 模式 的 实例 


层次 数据 模型 

层次 数据 模型 是 网 状 模型 的 一 种 受 限 形式 。 与 网 状 模型 相同 ， 数 据 被 表示 成 一 组 记录 ， 
联系 被 表示 成 络 。 然 而 ， 层 次 数据 模型 规定 一 个 节点 只 能 有 一 个 父 节 点 。 因 此 ， 层 次 数据 模 
型 被 表示 成 树 形 结构 ， 记 录 作 为 节点 ERAR), KERA., B 2-6 表示 了 与 图 2-4 具有 相 
同 数 据 的 层次 模式 的 实例 。 最 著名 的 层次 DBMS 是 IBM W IMS, RE IMS 也 具有 非 层次 特 
点 。 在 本 书 的 网 站 上 (URL 见 前 言 ) 更 详细 地 讨论 了 层次 数据 模型 。 

基于 记录 的 (逻辑 的 ) 数据 模型 用 来 说 明 数 据 库 的 整体 结构 ， 以 及 实现 的 较 高 层 描述 。 
它 的 主要 局 限 性 在 于 ,没有 提供 足够 的 机 制 以 说 明 对 数据 的 约束 ， 而 基于 对 象 的 数据 模型 虽 
缺少 逻辑 结构 的 描述 ， 但 提供 了 更 多 的 语义 成 分 以 支持 用 户 说 明 对 数据 的 约束 。 

现代 的 商业 系统 大 多 数 是 基于 关系 模型 的 ， 早 期 的 数据 库 系统 是 基于 网 状 或 者 层次 数 
据 模 型 的 。 后 两 个 模型 要 求 用 户 具 体 了 解 所 访问 的 物理 数据 库 ， 而 前 者 提供 了 更 多 的 数据 独 
立 性 。 因 此 ， 关 系 系 统 对 数据 库 处 理 采 用 说 阴性 的 方法 (也 就 是 仅 说 明 需 要 检索 什么 数据 )， 
而 网 状 和 层次 系统 采用 导航 的 方法 (也 就 是 说 明 如 何 检索 数据 ) 。 
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图 2-6 层次 模式 的 实例 


2.3.3 物理 数据 模型 


物理 数据 模型 描述 数据 是 如 何 存储 在 计算 机 中 的 ， 涉 及 记录 结构 、 记 录 顺 序 及 访问 路 径 
等 信息 。 并 不 存在 像 逻 辑 数据 模型 那么 多 种 物理 数据 模型 ， 最 常见 的 是 统一 模型 ( unifying 
model) 和 帧 存储 (frame memory ) o 


2.3.4 ”概念 建 模 


通过 对 三 层 体 系 结构 的 研究 ， 可 以 发 现 概念 模式 是 数据 库 的 核心 。 它 支持 所 有 外 部 视 
图 ， 本 身 由 内 部 模式 支持 。 然 而 ， 内 部 模式 仅仅 是 概念 模式 的 物理 实现 ， 概 念 模式 才 应 该 是 
企 事业 单位 所 有 数据 需求 的 一 个 完全 、 准 确 的 表示 。9 否 则 ， 关 于 该 单位 的 一 些 信息 将 会 被 
丢失 或 者 被 不 正确 地 表示 ， 结 果 导 致 很 难 完全 实现 一 个 或 多 个 外 部 视图 。 

概念 建 模 (或 称 概念 数据 库 设 计 ) 是 一 个 建 模 过 程 ， 所 建 模型 表达 了 企 事业 单位 所 用 信 
息 ， 但 不 考虑 所 有 实现 的 细节 ， 如 目标 DBMS 、 应 用 程序 、 编 程 语言 或 任何 其 他 的 物理 因 
素 。 这 个 模型 称 为 概念 数据 模型 。 概 念 数 据 模型 有 时 在 文献 中 也 称 “ 逻 辑 模型 ”。 然 而 在 本 
书 中 ， 对 概念 数据 模型 和 逻辑 数据 模型 加 以 区 分 。 概 念 模型 独立 于 所 有 的 实现 细节 ， 而 逻辑 
模型 假定 已 知 目标 DBMS 支持 的 数据 模型 。 在 第 16 和 17 章 中 给 出 了 设计 数据 库 的 方法 学 ， 
该 方法 学 首先 创建 一 个 概念 数据 模型 ， 然 后 再 构成 基于 关系 数据 模型 的 逻辑 模型 。10.6 节 将 
更 详细 地 介绍 数据 库 的 设计 。 


2.4 DBMS 的 功能 

本 节 讨 论 DBMS 应 该 提供 的 功能 和 服务 的 种 类 。Codd (1982) 给 出 过 完整 的 DBMS 应 
该 提供 的 八 种 服务 ， 在 此 基础 上 ， 本 书 又 增加 了 两 种 。 

(1) 数据 存储 、 检 索 和 更 新 

DBMS 必须 为 用 户 提供 在 数据 库 中 存储 、 检 索 和 更 新 数据 的 能 力 。 


”在 数据 库 设计 的 上 下 文中 谈 到 组 织 机 构 (organization)， 通 常 将 行业 (business) 和 组 织 机 构 统称 为 企 事业 
单位 (enterprise)。 
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这 是 DBMS 最 基本 的 功能 。 从 2.1 节 的 讨论 知道 ， 为 了 能 够 清晰 地 提供 这 个 功能 ， 
DBMS 应 对 用 户 隐藏 内 部 物理 实现 的 细节 (例如 文件 的 组 织 和 存储 结构 )。 

(2) 用 户 可 访问 的 目录 

DBMS 必须 提供 一 个 目录 ， 内 存 各 类 数据 项 的 描述 并 允许 用 户 访问 。 

ANSI-SPARC 体系 结构 的 一 个 关键 特点 是 要 求 提供 一 个 集成 的 系统 目录 ， 目 录 中 包含 关 
于 模式 、 用 户 、 应 用 程序 等 信息 的 描述 。 这 个 目录 对 用 户 和 DBMS 都 是 可 访问 的 。 系 统 目 
录 或 者 数据 字典 是 描述 数据 库 中 数据 的 信息 库 ， 存 储 的 是 “关于 数据 的 数据 ”或 称 为 元 数 
据 。 信 息 量 以 及 信息 的 使 用 方式 依 DBMS 而 异 。 系 统 目 录 通 常 存 储 : 

e 数据 项 的 名 字 、 类 型 和 大 小 。 

e 联系 的 名 字 。 

o 数据 的 完整 性 约束 。 

o 授权 访问 数据 的 用 户 的 名 字 。 

e 每 个 用 户 能 访问 的 数据 项 及 访问 的 类 型 ， 如 插入 、 修 改 、 删 除 和 检索 访问 。 
e 外 部 、 概 念 和 内 部 模式 及 模式 之 间 的 上 映射， 如 2.1.4 节 所 述 。 

© 各 种 统计 量 ， 例 如 事务 的 频率 、 对 数据 库 中 对 象 的 访问 次 数 。 

DBMS 系统 目录 是 系统 的 基本 组 件 。 下 一 节 将 描述 的 多 个 软 组 件 都 依赖 于 系统 目录 中 的 
信息 。 系 统 目 录 的 优点 有 : 

e 关于 数据 的 信息 可 集中 存放 ， 这 有 助 于 将 数据 作为 资源 进行 控制 。 

e 可 以 定义 数据 的 意义 ， 从 而 帮助 其 他 用 户 了 解数 据 的 用 途 。 

由 于 存储 了 信息 的 确切 含义 ， 所 以 能 简化 信息 的 通信 。 系 统 目 录 还 可 以 确定 拥有 和 
访问 数据 的 用 户 和 用 户 群 。 

由 于 数据 被 集成 ， 所 以 更 容易 识别 元 余 和 不 一 致 性 。 

e 可 记录 对 数据 库 的 修改 。 

e 由 于 系统 目录 记录 了 每 个 数据 条 目 、 其 所 有 联系 和 所 有 有 用户， 所 以 一 个 修改 实际 发 
生 之 前 就 可 以 确定 它 将 产生 的 影响 。 

可 以 加 强 安全 性 。 

© 确保 完整 性 。 

可 以 提供 审计 信息 。 

有 些 著 作者 区 分 系统 目录 和 数据 字典 ， 认 为 数据 字典 中 还 应 包含 数据 存放 位 置 及 存 
储 方式 等 信息 。 国 际 标准 化 组 织 收录 了 一 个 关于 数据 字典 的 标准 ， 称 为 信息 资源 字典 系统 
(IRDS) (ISO 1990，1993)。IRDS 是 个 软件 工具 ， 能 用 于 对 组 织 机 构 内 的 信息 源 进 行 控 制 和 
制定 文档 ， 它 还 给 出 了 用 于 组 织 数 据 字 典 的 表 的 定义 以 及 对 这 些 表 的 操作 。 本 书 使 用 术语 
“系统 目录 ” 指 代 所 有 的 库存 储 信息 。 我 们 将 在 23.4.1 节 进 一 步 讨 论 那些 存在 系统 目录 中 用 
于 查询 优化 的 统计 信息 。 

(3) 事务 支持 

DBMS 必须 提供 一 个 机 制 ， 确 保 给 定 事务 的 所 有 更 新 操作 或 者 全 部 做 完 或 者 一 个 都 
不 做 。 

事务 是 由 用 户 或 者 应 用 程序 执行 的 一 系列 动作 ， 这 些 动 作 将 访问 或 者 修改 数据 库 的 内 
容 。 例 如 ，DreamHome 案例 的 一 个 简单 事务 可 能 是 疝 数 据 库 中 添加 一 位 新 员工 或 更 新 员工 
工资 ， 或 者 从 注册 表 删 除 一 处 房产 。 相 对 更 复杂 的 例子 可 能 是 ， 从 数据 库 中 删除 一 名 员工 ， 
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并 且 将 他 所 管理 的 房产 重新 分 配给 其 他 员工 。 在 这 种 情况 下 ， 需 要 对 数据 库 进行 多 次 修改 。 
由 于 计算 机 骨 演 ， 事 务 可 能 在 执行 过 程 中 失败 ， 这 时 数据 库 将 处 于 不 一 致 的 状态 : 一 些 修改 
已 经 执行 ， 而 男 外 一 些 修改 还 没有 发 生 。 那 么 ,已 经 执行 的 修改 必须 被 恢复 ,使 数据 库 重新 
回 到 一 致 的 状态 。22.1 节 将 讨论 事务 支持 。 

(4) 并 发 控制 服务 

DBMS 必须 提供 一 个 机 制 ， 确 保 当 多 个 用 户 并 行 地 更 新 数据 库 时 ， 数 据 库 的 更 新 是 正确 的 。 

使 用 DBMS 的 一 个 主要 目的 是 使 多 个 用 户 能 够 同时 访问 共享 的 数据 。 如 果 所 有 用 户 只 
是 读 取 数据 ， 则 并 发 访问 是 相对 容易 的 ， 因 为 这 种 情况 下 他 们 不 会 相互 影响 。 然 而 ， 当 两 
个 或 多 个 用 户 同 时 访问 数据 库 ， 并 且 他 们 中 至 少 有 一 个 正在 更 新 数据 时 ， 可 能 会 产生 相互 影 
啊 ， 导 致 不 一 致 性 。 例 如 ， 考 虑 图 2-7 中 表示 的 两 个 并 发 执行 的 事务 T Al To. 


T; T 


read(bal,) 
read(bal,) bal, = bal, + 100 


bal, = bal, — 10 write(bal,) 
write(bal,) 





2-7 “丢失 更 新 的 问题 


Ti 正在 从 一 个 账户 中 (余额 bal,) 提取 10 英镑 ,而 Ts 正在 向 同一 个 账户 中 存储 100 英 
镑 。 如 果 这 两 个 事务 被 顺序 地 执行 ， 一 个 做 完 再 做 另 一 个 并 且 没 有 交叉 ， 则 无 论 哪 一 个 先 
执行 ， 最 后 的 余额 都 将 是 190 英镑 。 然 而 ， 此 例 中 的 Ti A T: 两 个 事务 几乎 是 在 同一 时 间 开 
始 ， 它 们 两 个 读 取 到 的 余额 都 是 100 英镑 。T, 将 bal, 从 100 英镑 增加 到 200 英镑 ， 并 将 这 
个 更 新 存储 到 数据 库 中 。 同 时 ， 事务 T, 将 bal 从 100 英镑 中 减 去 10 英镑 ， 剩 下 90 英镑 ， 
也 将 这 个 值 存储 到 数据 库 中 ， 覆 盖 了 前 面 的 更 新 ， 因 此 就 “丢失 ”了 100 英镑 。 

DBMS 必须 确保 当 多 个 用 户 同 时 访问 数据 库 时 ， 一 定 不 能 发 生 冲 突 。22.2 节 将 详细 讨论 
这 个 问题 。 

( 5 ) 恢复 服务 

DBMS 必须 提供 一 个 机 制 ， 无 论 数 据 库 因 何 原因 受到 破坏 时 ， 都 能 恢复 数据 库 。 

讨论 事务 支持 时 和 兽 述 ， 如 采 事 务 执行 失败 ， 数 据 库 必须 返回 到 一 个 一 致 的 状态 。 失 败 可 
能 是 由 于 系统 月 演 、 介 质 失 效 或 由 于 软 硬 件 的 错误 导致 DBMS 终止 ， 也 可 能 是 由 于 用 户 在 
事务 过 程 中 检测 到 一 个 错误 ， 从 而 强迫 事务 终止 的 结果 。 在 所 有 情况 下 ，DBMS 必须 提供 一 
个 机 制 ， 将 DBMS 恢复 到 一 个 一 致 的 状态 。22.3 节 将 讨论 数据 库 的 恢复 。 

(6) 授权 服务 

DBMS 必须 提供 一 个 机 制 ， 确 保 只 有 经 过 授权 的 用 户 才 可 以 访问 数据 库 。 

不 难 发 现 这 样 一 种 情形 ， 数 据 库 中 存储 的 数据 不 硕 望 被 所 有 的 用 户 看 到 。 例 如 ， 与 全 体 
员工 的 工资 相关 的 信息 可 能 只 允许 经 理 看 到 ， 而 其 他 的 用 户 禁 止 访问 这 些 数据 s 此 外 ， 要 保 
证 数据 库 不 被 未 授权 的 用 户 访 问 。 术 语 “ 安 全 性 ”就 是 指 保护 数据 库 不 被 未 授权 者 访问 。 一 
般 要 求 DBMS 提供 一 个 机 制 ， 能 够 确保 数据 的 安全 。 第 20 章 将 讨论 安全 性 问题 。 

(7) 支持 数据 通信 

DBMS 必须 能 够 与 通信 软件 集成 。 

大 多 数 用 户 是 从 工作 站 访问 数据 库 的 。 有 时 这 些 工 作 站 直接 与 DBMS 主机 相连 ， 而 男 


#27 BRUHBERHH 39 


外 一 些 情况 下 ， 这 些 工作 站 存放 在 异地 ， 需 要 通过 网 络 与 DBMS 主机 进行 通信 。 无 论 哪 种 
情况 ，DBMS 将 访问 请 求 作 为 通信 消息 接受 ， 并 且 以 同样 的 方式 进行 回复 。 所 有 这 些 转换 都 
是 通过 一 个 数据 通信 管理 硕 (Data Communication Manager, DCM) 处 理 的 。 尽 管 DCM 不 
是 DBMS 的 一 部 分 ， 如 果 期 望 DBMS 系统 能 够 商业 化 ， 就 有 必要 使 DBMS 能 够 与 各 种 各 样 
的 DCM 集成 。 即 使 是 用 于 个 人 计算 机 的 DBMS ， 也 应 该 能 够 在 一 个 局 域 网 上 运行 ， 这 样 可 
以 建立 一 个 集中 的 数据 库 供 所 有 用 户 共享 ， 而 不 是 创建 一 系列 分 离 的 数据 库 再 分 别 归属 每 个 
用 户 。 这 并 不 意味 着 数据 库 必 须 在 网 络 上 分 布 ， 而 是 要 求 用 户 应 该 能 够 从 远程 访问 一 个 集中 
的 数据 库 。 一 般 将 这 种 类 型 称 为 分 布 式 处 理 结构 (参见 24.1.1 节 )。 

( 8 ) 完整 性 服务 

DBMS 必须 提供 一 种 方法 ， 确 保 数 据 库 中 的 数据 和 对 数据 的 修改 遵循 一 定 的 规则 。 

“数据 库 完整 性 ” 指 的 是 所 存储 数据 的 正确 性 和 一 致 性 ， 它 可 以 被 看 成 是 另外 一 种 类 型 
的 数据 库 保 护 。 虽 然 完 整 性 与 安全 性 是 相 联系 的 ， 但 它 还 具有 更 广 的 含意 : 完整 性 与 数据 本 
吴 的 性 质 有 关 。 完 整 性 通常 是 通过 约束 的 形式 表示 ， 给 出 数据 库 不 能 违反 的 一 致 性 规则 。 例 
如 ， 可 能 需要 这 样 一 个 约束 ， 任 何 员工 都 不 能 同时 管理 多 于 100 处 房产 。 因 此 ， 当 给 某 位 员 
工分 配 房产 时 ，DBMS 就 检查 这 个 约束 ， 确 保 不 超过 此 限制 ， 若 分 配 的 数量 超过 此 限制 则 终 
止 这 次 分 配 。 

除了 以 上 从 项 服务 以 外 ， 还 可 以 要 求 DBMS 具备 下 列 两 个 服务 。 

( 9 ) 提高 数据 独立 性 的 服务 

DBMS 必须 提供 机 制 ， 使 程序 独立 于 数据 库 的 实际 结构 。 

在 2.1.5 市 中 已 经 讨论 过 数据 独立 性 的 概念 。 数 据 独 立 性 通常 是 通过 视图 或 者 子 模式 的 
机 制 得 到 。 物 理 数据 独立 性 较 容易 获得 : 在 不 影响 视图 的 情况 下 ， 可 以 对 数据 库 的 物理 特性 
进行 多 种 修改 。 然 而 ， 完 全 的 逻辑 数据 独立 性 很 难 达 到 。 新 增 实 体 、 属 性 或 联系 尚 可 以 接 
受 ， 删 除 则 不 同 。 在 一 些 系统 中 ， 对 逻辑 结构 中 任何 成 分 的 修改 都 是 不 允许 的 。 

(10) 实用 服务 程序 

DBMS 应 该 提供 一 组 实用 服务 程序 。 

实用 程序 可 以 帮助 DBA 高 效 地 管理 数据 库 。 一 些 实用 程序 所 做 工作 发 生 在 外 部 层 ， 因 
此 可 由 DBA 完成 。 其 他 工作 发 生 在 内 部 层 ， 只 能 由 DBMS 供应 商 提 供 。 后 一 种 类 型 实用 程 
序 的 例子 有 : 

e 输入 机 制 ， 即 从 平板 文件 中 装载 数据 库 ; 输出 机 制 ， 即 将 数据 库 印 载 到 平板 文件 中 。 
监控 机 制 ， 用 以 监测 数据 库 的 使 用 和 运作 。 
统计 分 析 程 序 ， 用 以 检查 性 能 或 者 统计 数据 。 
重新 组 织 索引 的 机 制 ， 用 以 重新 组 织 索引 并 处 理 溢出 。 
无 用 单元 收集 和 重新 分 配 机 制 ， 用 于 从 存储 设备 中 物理 地 删除 记录 ， 回 收 已 释放 的 
空间 并 重新 分 配给 需要 者 。 


本 章 小 结 

e ANSI-SPARC 数据 库 体系 结构 使 用 三 层 抽 象 : 外 部 层 、 概 念 层 和 内 部 层 。 外 部 层 包 含 用 户 对 数据 库 
的 视图 。 概 念 层 是 数据 库 的 整体 视图 ， 它 说 明 整 个 数据 库 系 统 的 信息 内 容 ， 与 存储 因素 无 关 。 概 念 
层 表 现 所 有 的 实体 、 实 体 的 属性 、 实 体 之 间 的 联系 、 对 数据 的 约束 ， 以 及 安全 性 和 完整 性 信息 。 内 
部 层 是 数据 库 的 计算 机 视图 ， 它 说 明 数 据 如 何 表示 、 记 录 如 何 排序 、 存 在 什么 样 的 索引 和 指针 等 。 
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外 部 层 到 概念 层 的 映射 负责 转换 概念 屋 和 外 部 层 之 间 的 请 求 和 结果 。 概 念 层 到 内 部 层 的 映射 转换 概 
念 层 和 内 部 层 之 间 的 请 求 和 结果 。 

数据 库 模式 是 对 数据 库 结构 的 描述 。 数 据 独立 性 使 每 一 层 都 不 会 被 较 低 层 的 变化 所 影响 。 逻 辑 数据 
独立 性 指 的 是 外 部 模式 不 会 被 概念 模式 的 变化 所 影响 。 物 理 数据 独立 性 指 的 是 概念 模式 不 会 被 内 部 
模式 的 变化 所 影响 。 

数据 子 语言 包含 两 个 部 分 : 数据 定义 语言 (DDL) 和 数据 操作 语言 ( DML)。DDL 用 来 说 明 数 据 库 
fist, DML 用 来 读 取 和 更 新 数据 库 。DML 中 包含 的 数据 检索 部 分 称 为 查询 语言 。 
数据 模型 是 一 组 概念 ， 可 以 用 于 描述 数据 、 对 数据 的 操作 以 及 对 数据 的 完整 性 规则 。 数 据 模型 可 分 
成 三 大 类 : 基于 对 象 的 数据 模型 、 基 于 记录 的 数据 模型 和 物理 数据 模型 。 前 两 个 用 来 描述 概念 层 和 
外 部 层 的 数据 ， 后 一 个 用 来 描述 内 部 层 的 数据 。 

基于 对 象 的 数据 模型 包括 实体 -联系 的 、 语 义 的 、 函 数 的 和 面向 对 象 的 四 类 模型 。 基 于 记录 的 数据 
模型 包含 关系 、 网 状 和 层次 三 类 模型 。 

概念 建 模 是 构建 数据 库 详 细 结 构 的 过 程 ， 此 结构 与 具体 的 实现 细节 无 关 ， 包 括 目 标 DBMS, 、 应 用 程 
序 、 编 程 语言 以 及 任何 其 他 的 物理 因素 。 概 念 模式 的 设计 对 整个 系统 的 成 功 事 关 重要 。 花 费 必要 的 
时 间 和 精力 创建 一 个 尽 可 能 好 的 概念 设计 非常 值得 。 

多 用 户 DBMS 的 功能 和 服务 包括 : 数据 的 存储 、 检 索 和 修改 ; 用 户 可 访问 的 目录 ; 事务 支持 ; 并 
发 控制 和 恢复 服务 ; 授权 服务 ; 对 数据 通信 的 支持 ; 完整 性 服务 ; 提供 数据 独立 的 服务 和 实用 程序 。 
系统 目录 是 DBMS 的 基本 组 件 之 一 。 它 包含 “数据 的 数据 "， 或 称 为 元 数据 。 目 录 必 须 是 用 户 可 访 
问 的 。 信 息 资 源 字典 系统 是 一 个 ISO 标准 ， 定 义 了 一 组 访问 数据 字典 的 方法 。 这 样 就 允许 共享 字 
典 ， 并 且 可 以 从 一 个 系统 转换 到 另 一 个 系统 。 


思考 题 


2 


讨论 数据 独立 性 的 概念 ， 并 说 明 它 在 数据 库 环境 中 的 重要 性 。 


2.2 ANSI-SPARC 三 层 体系 结构 是 为 解决 数据 独立 性 问题 提出 的 。 比 较 和 对 比 这 个 模型 中 的 三 个 


2.3 


层次 。 
什么 是 数据 模型 ? 讨论 数据 模型 的 主要 类 型 。 


2.4 讨论 概念 建 模 的 功能 和 重要 性 。 


2.5 


你 希望 一 个 多 用 户 DBMS 提供 哪些 功能 ? 


2.6 ”针对 思考 题 2.5 的 答案 ， 你 认为 在 孤立 的 PC DBMS 中 哪 一 个 是 不 必要 的 。 给 出 理由 。 
2.7 讨论 系统 目录 的 功能 和 重要 性 。 

2.8 tit DDL 与 DML 有 何 差异 。 你 期 望 每 种 语言 通常 提供 哪些 操作 ? 

2.9 ”讨论 过 程 化 DML 与 非 过 程 化 DML 有 何 差异 。 


2.1 
EA 
2.1 
2.1 
2.1 


>] 
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0 给 出 四 类 基于 对 象 的 数据 模型 的 名 称 。 

1 给 出 三 类 基于 记录 的 数据 模型 的 名 称 ， 并 讨论 它们 之 间 的 主要 差别 。 
2 何谓 事务 ? 试 举 一 个 例子 。 

3 何谓 并 发 控制 ? DBMS 为 何 需 要 并 发 控制 机 制 。 

4 给 出 数据 库 完 整 性 定义 ， 数 据 库 完整 性 与 数据 库 安 全 性 有 何 区 别 。 


题 
5 请 分 析 你 目前 正在 使 用 的 各 种 DBMS。 确 定 每 个 系统 是 否 提供 了 你 认为 DBMS 应 该 提供 的 功 
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能 。 每 个 系统 都 提供 了 什么 类 型 的 语言 ? 每 个 DBMS 使 用 了 哪 种 类 型 的 体系 结构 ? 检查 系统 目 
录 的 可 访问 性 和 可 扩展 性 。 是 否 可 能 将 系统 目录 输出 到 另 一 个 系统 中 ? 

2.16 ”编写 程序 在 数据 库 中 存储 名 字 和 电话 号 码 。 再 编写 一 个 程序 在 数据 库 中 存储 名 字 和 地 址 。 修 改 
这 些 程序 使 之 用 到 外 部 、 概 念 和 内 部 模式 。 这 样 修改 的 优点 和 缺点 分 别 是 什么 ? 

2.17 编写 程序 在 数据 库 中 存储 名 字 和 出 生日 期 。 对 该 程序 进行 扩展 ,使 其 能 存储 数据 库 中 数据 的 格 
式 ， 换 句 话 说 就 是 创建 一 个 系统 目录 。 提 供 可 由 外 部 用 户 访问 该 系统 目录 的 界面 。 
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数据 库 的 结构 与 Web 





| 本 章 目标 

本 章 我 们 主要 学 习 : 

o 客户 一 服务 器 结构 的 意义 及 这 种 结构 给 DBMS 带 来 的 好 处 
两 层 、 三 层 和 多 层 客户 - 服务 器 结构 的 差别 
应 用 服务 器 的 功能 
中 间 件 的 意义 及 中 间 件 的 不 同类 型 
事务 处 理 (TP) 监视 器 的 功能 和 用 处 
Web 服务 的 用 途 和 开发 Web 服务 的 技术 标准 
面向 服务 的 结构 (SOA) 的 含义 
分 布 式 DBMS 与 分 布 式 计 算 的 差别 
数据 仓库 的 体系 结构 
云 计算 与 云 数据 库 
DBMS 的 软件 组 件 
Oracle 的 逻辑 结构 与 物理 结构 


第 1 章 回顾 了 数据 库 系 统 自 20 世纪 60 年 代 以 来 的 发 展 。 在 这 几 十 年 间 ， 虽 然 用 户 期 望 
的 种 种 数据 库 功 能 不 断 变 为 现实 ， 一 些 新 的 基础 数据 模型 也 不 断 推出 并 得 以 实现 ,但 比较 起 
来 ， 开 发 软件 系统 所 用 的 软件 范 型 变化 得 更 多 、 更 快 。 数 据 库 开发 商 们 不 得 不 了 解 并 跟 进 这 
些 变 化 ， 以 保证 不 落伍 。 本 章 我 们 首先 考察 一 些 目前 已 投入 使 用 的 不 同系 统 的 结构 ， 然 后 讨 
论 有 关 Web 服务 和 面向 服务 的 结构 (SOA) 的 进展 。 


| 本 章 结构 

3.1 节 考 察 多 用 户 DBMS， 重 点 是 两 层 和 三 层 客户 -服务 器 结构 ， 并 讨论 中 间 件 的 概念 以 
及 数据 库 领 域 不 同类 型 的 中 间 件 。3.2 节 研 究 Web 服务 和 SOA， 前 者 用 于 为 用 户 提供 新 型 的 
业务 服务 ， 后 者 有 助 于 设计 松 耦 合 、 自 治 的 服务 ， 这 些 服 务 能 组 合成 更 灵活 、 复 杂 的 业务 过 
程 和 应 用 。3.3 节 简要 描述 分 布 式 DBMS 的 结构 并 讨论 其 与 分 布 式 计算 的 区 别 ， 第 24 一 25 章 
将 详细 讨论 分 布 式 DBMS。3.4 节 简 要 描述 数据 仓库 及 相关 工具 的 结构 ， 第 31 一 34 章 将 详 
细 讨 论 数据 仓库 。3.5 节 讨 论 云 计算 和 云 数 据 库 。3.6 节 给 出 一 个 抽象 DBMS 的 内 部 结构 。3.7 
节 专 门 讨 论 Oracle DBMS 的 逻辑 结构 和 物理 结构 。 


3.1 多 用 户 DBMS 结构 


本 节 将 会 介绍 实现 多 用 户 数据 库 管理 系统 的 各 种 常见 结构 ， 包 括 远程 处 理 、 文 件 - 服务 
船 和 客户 - 服务 器 结构 。 
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3.1.1 远程 处 理 


传统 的 多 用 户 系统 结构 是 远程 处 理 ， 在 这 类 系统 中 有 一 台 计 算 机 ， 它 由 单个 中 央 处 理 单 
元 (CPU) FA FA ZH AR, WA 3-1 所 示 。 所 有 = 
处 理 都 在 这 台 物 理 计算 机 的 边界 内 执行 。 用 户 终端 | 
通常 为 “ 哑 ” 终 端 ， 无 处 理 能 力 。 它 们 通过 线 缆 与 ” 
中 央 计 算 机 相连 。 终 端 通过 操作 系统 的 通信 处 理子 E | 
系统 向 用 户 应 用 程序 传递 信息 ， 用 户 应 用 程序 轮流 eee 
使 用 DBMS 的 服务 。 结 果 信 息 又 以 同样 的 方式 传 Ee 
回 用 户 终端 。 然 而 ， 这 种 体系 结构 给 中 央 计 算 机 带 图/ 二 一 ene [jc 
来 了 很 大 的 压力 ， 使 中 心计 算 机 不 仅 要 运行 应 用 程 a a = ig |= 
序 和 DBMS， 还 要 代替 终端 执行 大 量 的 工作 (例如 gn es 
格式 化 屏幕 显示 数据 等 )。 图 3-1 远程 处 理 的 拓扑 结构 

近 几 年 ， 个 人 计算 机 和 网 络 的 性 能 有 很 大 提高 。 可 以 看 到 ， 工 业界 具有 向 小 型 化 发 展 的 
趋势 ， 也 就 是 以 能 实现 相同 功能 甚至 更 强 功能 的 、 比 较 经 济 的 个 人 计算 机 组 成 的 网 络 代替 晶 
贵 的 大 型 计算 机 。 这 个 趋势 导致 了 下 面 两 个 结构 的 出 现 : 文件 服务 器 和 客户 - 服务 器 。 


3.1.2 文件 服务 器 结构 





ee 一 


文件 服务 器 | 在 网 络 上 的 一 台 计 算 机 ， 其 主要 用 途 是 为 文档 、 电 子 表 格 、 图 像 和 数据 库 之 
类 的 计算 机 文件 提供 共享 存储 。 


在 文件 服务 器 环境 中 ， 数 据 处 理 通常 在 局 域 网 
(LAN) 上 分 布 进行 。 文 件 服务 器 负责 保管 应 用 程 
序 和 DBMS 所 需要 的 文件 。 而 应 用 程序 和 DBMS 
实际 运行 在 各 个 工作 站 点 上 ， 必 要 时 间 文 件 服务 器 
请 求 文件 ， 如 图 3-2 所 示 。 通 过 这 种 方法 ， 文 件 服 
务 器 只 是 扮演 了 一 个 共享 硬盘 驱动 器 的 角色 。 每 个 
工作 站 上 的 DBMS 都 向 文件 服务 器 传送 请 求 ， 请 
求 DBMS 所 需要 的 所 有 存储 在 磁盘 中 的 数据 。 显 
然 ， 这 种 方法 容易 造成 网 络 拥塞 (traffic)， 导 致 性 
能 方面 的 问题 。 例 如 ， 用 户 请 求 查询 位 于 Main 大 
街 163 号 的 分 公司 的 员工 的 名 字 。 若 使 用 SQL ( 参 





a 
Hed 


见 第 6 BE) 表达 这 个 请 求 ， 则 为 : ma 数据 
文件 服务 器 
SELECT fName, IName 图 3-2 文件 服务 器 结构 


FROM Branch b, Staff s 

WHERE b.branchNo = s.branchNo AND b.street = ‘163 Main St’; 

由 于 文件 服务 器 不 懂 SQL, DBMS 不 得 不 从 文件 服务 器 中 请 求 整个 Branch 和 Staff X 
系 ， 而 不 仅仅 是 符合 要 求 的 员工 的 名 字 。 

因此 ， 文 件 服务 器 结构 具有 三 个 主要 缺点 : 

(1 ) 会 造成 网 络 拥塞 。 

(2) 每 台 工 作 站 上 都 要 求 有 一 个 DBMS 的 完整 副本 。 
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(3) 并 发 、 恢 复 和 完整 性 控制 变 得 相当 复杂 ， 因 为 可 能 有 多 个 DBMS 访问 同一 个 文件 。 


3.1.3 ”传统 的 两 层 客户 -服务 器 结构 


为 了 克服 前 面 两 种 方法 的 缺点 并 且 适 应 日 益 分散 
的 业务 环境 ， 人 们 提出 了 客户 - 服务 器 结构 。 客 户 - 
服务 器 指 的 是 软 组 件 相互 作用 形成 系统 的 一 种 方式 。 
顾名思义 ， 此 方法 中 存在 一 个 请 求 资源 的 客户 进程 和 
一 个 提供 资源 的 服务 器 。 但 并 不 要 求 客 户 和 服务 器 同 
处 一 台 机 器 。 实 际 常见 的 情况 是 ， 服 务 器 放 在 局 域 网 
的 一 个 站 点 ， 而 客户 在 另外 一 些 站 点 。 图 3-3 说 明了 
客户 - 服务 器 结构 ， 图 3-4 给 出 各 种 可 能 的 客户 - 服 
务 器 拓扑 结构 。 

数据 密集 型 的 业务 应 用 程序 一 般 由 四 个 主要 部 分 
组 成 : 数据 库 、 事 务 逻 辑 、 业 务 及 数据 应 用 逻辑 和 用 ll 
户 界面 。 传 统 的 两 层 客 户 - 服务 器 结构 提供 了 基本 pe 
的 任务 划分 。 客 户 端 (第 1 层 ) 主要 负责 针对 用 户 的 ene i 
数据 表示 ， 服 务 器 端 (第 2 层 ) 主要 负责 为 客户 端 提 
供 数 据 服务 。 图 3-5 显示 了 这 种 结构 。 表 示 服 务 负责 处 理 用 户 交 互 活动 和 主要 的 业务 及 数 
据 应 用 逻辑 。 数 据 服 务 负 责 提 供 有 限 的 业务 应 用 逻辑 、 客 户 端 由 于 缺乏 信息 通常 不 能 执行 
的 验证 ， 以 及 对 与 其 位 置 无 关 的 请 求 数据 的 访问 。 数 据 可 以 来 自 于 关系 DBMS 、 对 象 关系 
DBMS 、 面 向 对 象 DBMS 、 历 史 遗 留 的 DBMS 以 及 专 有 的 数据 访问 系统 。 通 常客 户 端 运行 
在 终端 用 户 的 桌面 上 ， 通 过 网 络 与 中 心 数据 库 服务 器 通信 。 








a) 单 客户 端 、 单 服务 器 b) 多 客户 端 、 单 服务 器 c) 多 客户 端 、 多 服务 器 
3-4 可 供 选 择 的 客户 - 服务 器 拓扑 结构 


客户 端 和 服务 器 之 间 交 互 的 典型 过 程 是 ， 客 户 端 接收 用 户 的 请 求 ， 检 查 语法 并 产生 用 
SQL 或 其 他 某 种 适 于 应 用 程序 逻辑 的 数据 库 语 言 表 达 的 数据 库 请 求 。 然 后 将 请 求 消息 传递 
给 服务 器 ， 等 竺 回答。 得 到 回答 后 再 将 其 格式 化 并 传递 给 终端 用 户 。 服 务 器 接收 和 处 理 数 据 
库 请 求 ， 并 将 结果 回 传 给 客户 端 。 这 个 过 程 包括 检查 权限 、 确 保 完 整 性 、 维 护 系 统 目 录 ， 以 
及 执行 查询 和 更 新 操作 。 男 外 ， 它 还 提供 并 发 和 恢复 控制 。 在 表 3-1 中 总 结 了 客户 端 和 服务 
Ar HJERTE o 
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第 一 层 we RO 任务 
客户 端 Et | 。 用 户 界面 
。 主 要 的 业务 和 数据 处 理 逻 辑 
See ee 2 ea eee 和 
数据 库 服务 器 a 。 服 务 器 端 确认 
=] 。 数 据 访问 
| | | 


图 3-5 “传统 的 两 层 客户 -WRA Art 


表 3-1 客户 -服务 器 功能 总 结 


客 FR it AR 3S 器 
管理 用 户 界 面 接受 和 处 理 来 自 客户 端的 数据 库 请 求 
接受 和 检查 用 户 输 入 的 语法 检查 授权 
处 理应 用 逻辑 确保 不 违反 完整 性 约束 
产生 数据 库 请 求 并 传送 给 服务 各 执行 查询 /更 新 操作 并 将 结果 回 传 给 客户 端 
将 结果 返回 给 用 户 维护 系统 目录 
提供 并 发 的 数据 库 访问 
提供 恢复 控制 


这 种 结构 有 许多 优点 ， 例 如 : 
o 广泛 支持 对 现存 数据 库 的 访问 。 
o 增强 性 能 : 如 果 客 户 端 和 服务 器 在 不 同 的 计算 机 上 ， 则 不 同 的 CPU 可 以 并 行 处 理应 
用 程序 。 如 果 服 务 器 的 任务 仅 是 执行 数据 库 处理 ， 调 优 其 性 能 则 较 容 易 。 
e 降低 硬件 费用 : 只 要 求 服务 器 有 足够 的 存储 空间 和 处 理 能 力 来 存储 和 管理 数据 库 。 
o 降低 通信 费用 : 应 用 程序 在 客户 端 运行 了 一 部 分 操作 ， 只 有 数据 库 访 问 请 求 需要 通 
过 网 络 传递 ， 因 此 在 网 络 中 只 需要 传递 很 少 的 数据 。 
e 增强 一 致 性 : 服务 器 可 以 处 理 完整 性 检查 ， 因 此 只 需要 在 一 个 位 置 定 义 和 验 证 约束 ， 
而 无 需 每 个 应 用 程序 都 自行 检查 。 
e 能 很 自然 地 映射 到 开放 系统 结构 上 。 
某 些 数 据 库 供应 商会 把 这 种 结构 说 成 是 提供 分 布 式 数据 库 的 能 力 ， 也 就 是 多 个 逻辑 上 相 
互 关 联 的 分 布 在 计算 机 网 络 上 的 数据 库 。 然 而 ， 尽 管 客 户 - 服务 器 结构 可 用 于 实现 分 布 式 
DBMS， 但 它 本 身 并 不 构成 一 个 分 布 式 DBMS。3.3 节 将 讨论 分 布 式 DBMS ,第 24 和 25 章 
还 将 更 完整 地 进行 讨论 。 


3.1.4 三 层 客 户 - 服务 器 结构 
企业 对 可 伸缩 性 的 需要 正在 挑战 传统 的 两 层 客户 - 服务 器 模型 。 在 20 世纪 90 年 代 中 
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期 ， 由 于 应 用 程序 变 得 越 来 越 复 杂 ， 因 此 当 达 到 配置 成 百 上 千 个 终端 用 户 的 规模 时 ， 客 户 端 
表现 出 两 个 问题 ， 影 响 系统 的 可 伸缩 性 : 

e 胖 客户 问 为 了 高 效 运行 ， 要 求 客户 计算 机 具备 相当 高 的 配置 ， 包 括 磁盘 空间 、 内 存 

及 CPU 资源 。 

© 客户 端 管理 开销 相当 可 观 。 

1995 年 左右 ， 传 统 两 层 客户 - 服务 器 模型 的 一 种 新 变形 出 现 ， 它 显然 是 解决 企业 可 缩 
放 性 问题 的 一 种 较 好 方案 。 这 种 新 体系 结构 建议 使 用 三 层 结构 ， 每 层 均 可 运行 在 不 同 的 平 
AE. 

(1) 用 户 界 面 层 : 运行 在 终端 用 户 的 计算 机 上 (客户 端 )。 

(2) 业务 逻辑 和 数据 处 理 层 : 该 中 间 层 运行 在 服务 右上， 通常 称 为 应 用 服务 器 。 

(3) DBMS 层 : 存储 中 间 层 所 需 的 数据 。 该 层 运 行 在 称 为 数据 库 服 务 器 的 单独 服务 右上 。 

如 图 3-6 所 示 ， 客 户 端 现在 作为 瘦 客 户 端 仅仅 负责 应 用 程序 的 用 户 界 面 ， 也 许 还 执行 一 
些 简 单 的 业务 逻辑 处 理 ， 例 如 输入 验证 。 应 用 程序 的 核心 业务 逻辑 现在 处 于 单独 的 层 上 ， 通 


过 局 域 网 (LAN) 或 广域网 (WAN) 物理 连接 到 客户 端 和 数据 库 服务 器 。 一 个 应 用 服务 需 可 
为 多 个 客户 端 提 供 服务 。 


第 一 层 — 任务 
客户 端 =| 。 用 户 界 面 
Se Meigs fee Tl Oey 
应 用 服务 器 。 业务 逻辑 
。 数据 处 理 逻 辑 
和 Het. | 
数据 库 服务 器 。 数 据 确认 
。 数 据 访问 





图 3-6 三 层 结构 


三 层 设 计 与 传统 的 两 层 或 单 层 设计 相 比 有 许多 优点 ， 包 括 : 

o 瘦 客 户 端 降低 了 对 硬件 设备 的 需求 。 

e 业务 逻辑 从 许多 终端 用 户 转移 到 了 单一 的 应 用 服务 器 上 ， 这 使 得 应 用 程序 的 维护 可 

以 集中 进行 ， 消 除了 传统 两 层 客户 - 服务 器 模型 中 重点 关注 的 软件 分 布 问题 。 

e 模块 化 特性 使 得 修改 或 替换 其 中 一 层 不 会 影响 其 他 层 ， 因 而 变 得 更 容易 。 

© 核心 业务 逻辑 和 数据 库 功 能 的 分 离 使 得 负载 平衡 更 容易 进行 。 

另外 一 个 优点 是 三 层 结构 更 容易 映射 到 Web 环境 ，Web 浏览 器 可 作为 瘦 客 户 端 ，Web 
服务 器 可 作为 应 用 服务 器 。 
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3.15 NN 层 客户 - 服务 器 结构 


三 层 结构 可 以 扩展 为 n 层 结构 ， 通 过 增添 层次 可 以 提供 进一步 的 灵活 性 和 可 伸缩 性 ， 如 
图 3-7 所 示 ， 三 层 结 构 的 中 间 层 可 以 再 细 分 为 两 层 ， 
一 层 为 Web 服务 器 ， 一 层 为 应 用 服务 器 。 在 高 通 量 的 
环境 下 ， 单 个 Web 服务 需 可 由 一 组 Web 服务 需 (或 

一 个 Web 农场 ) 代替 ， 以 获得 高 效 的 负载 平衡 。 pai 


应 用 服务 如 


应 用 服务 器 | 通过 一 组 应 用 程序 编程 接口 (API) 
将 业务 逻辑 和 业务 过 程 暴 圳 给 其 他 应 用 使 用 。 


一 个 应 用 服务 需 必 须 处 理 以 下 在 干 复杂 的 问题 : 

并 发 

网 络 连接 管理 

提供 对 所 有 数据 库 服 务 咒 的 访问 

数据 库 连 接 池 

支持 遗留 数据 库 

文 持 集群 

© 负载 平衡 

e 失效 备 援 

在 第 29 章 我 们 将 考察 寿 干 应 用 服务 器 : 

e Java 平 台 企 业 版 (Java Platform, Enterprise 
Edition，JEE)， 早 先 称 为 J2EE， 是 用 Java 语 
言 编写 服务 器 的 平台 规范 。 像 其 他 Java 程序 社区 (Java Community Process) 规范 一 
样 ，JEE 也 被 非 正 式 地 看 作 一 个 标准 ， 软 件 提 供 商 必须 遵守 某 些 要 求 ， 以 保证 其 产 
品 是 “JEE 兼容 的 ”。 一 个 JEE 应 用 服务 器 能 处 理事 务 、 安 全 性 、 可 伸缩 性 、 并 发 和 
管理 部 署 在 其 上 的 多 个 部 件 。 这 意味 着 应 用 开发 人 员 能 把 注意 力 更 多 集中 在 业务 逻 
辑 上 ， 而 不 必 考 虑 基础 架构 和 集成 等 事情 。 

众所周知 的 JEE 应 用 服务 器 有 Oracle 公司 的 Weblogic Server 和 Oracle GoldFish 
Server， 红 帽 公 司 的 JBoss, IBM 的 WebSphere Application Server 和 开放 源码 的 Glass- 
Fish Application Server。 我 们 留待 29.7 节 再 讨论 JEE 平台 和 相关 的 数据 库 访问 技术 。 

© NET 框架 是 微软 公司 提供 的 用 于 开发 中 间 层 的 技术 ， 我 们 留待 29.8 节 讨 论 。 

Oracle Application Server 提供 了 一 组 服务 ， 可 用 于 集成 可 伸缩 的 多 层 结构 以 文 持 电 

子 商 务 ， 我 们 留待 29.9 节 讨 论 。 


3.1.6 中间 件 





图 3-7 ”中 间 层 分 裂 为 Web MRF Ar M 
应 用 服务 需 的 四 层 结构 


| 中 间 件 | 连接 软 部 件 或 应 用 的 计算 机 软件 。 


中 间 件 是 个 类 属 术语 ， 通 指 为 其 他 软件 做 媒介 或 帮助 一 个 异 构 系 统 中 各 应 用 间 通 信 的 软 
件 。 中 间 件 的 需求 来 自 于 分 布 式 系统 太 复杂 时 ， 若 没有 一 个 公用 接口 则 难以 有 效 管 理 。 为 了 
使 异 构 系 统 能 跨 网 工作 并 能 灵活 地 适应 频繁 的 修改 ， 开 发 中 间 件 以 隐藏 分 布 式 系统 基本 的 复 
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Hurwitz ( 1998 ) 将 中 间 件 主要 分 为 六 类 : 


异步 远程 过 程 调用 (RPC) : 这 是 一 种 进程 间 通 信 技 术 ， 它 允许 客户 端 向 另 一 地 址 空 

间 (通常 是 网 络 上 男 一 台 计 算 机 ) 发 出 服务 请 求 而 不 等 竺 回答。 一 个 RPC 通常 由 客 

户 端 发 起 ， 客 户 端 向 已 知 的 远程 服务 器 发 送信 息 ， 请 求 用 所 提交 的 参数 执行 某 个 过 

程 。 这 类 中 间 件 是 高 度 可 扩展 的 ， 因 为 只 有 很 少 的 连接 和 会 话 信 息 需 要 在 客户 端 和 

服务 咒 之 间 维 持 。 当 然 ， 知 连接 中 断 ， 客 户 端 不 得 不 从 头 再 来 ， 故 协议 具有 低 可 恢 

复 性 。 当 对 事务 完整 性 不 作 要 求 时 ， ,异步 RPC 最 为 适用 。 

同步 RPC: 类 似 于 异步 RPC， 只 是 服务 器 在 处 理 调用 请 求 时 客户 端 被 挂 起 ( 它 必须 等 

竺 服务 器 处 理 完 才能 重启 执行 )。 这 类 中 间 件 可 扩展 性 差 ， 可 恢复 性 却 最 好 。 

有 若干 与 RPC 类 似 的 协议 ， 如 : 

= Java 的 Remote Method Invocation(Java RMI)API 提供 了 与 标准 UNIX RPC 方法 类 

似 的 功能 。 

XML-RPC 也 是 一 种 RPC 协议 ， 它 用 XML 编码 请 求 ，HTTP 作为 传输 机 制 。 我 

们 将 在 第 29 章 讨论 HTTP， 第 30 章 讨 论 XML. 

m 微软 的 .NET Remoting 4 Windows 平台 的 分 布 式 系统 提供 RPC 机 制 。 我 们 将 在 
29.8 节 讨论 .NET 平 台 。 

= CORBA 通过 一 个 称 为 “对 象 请 求 代 理 ” 的 中 间 层 提供 远程 过 程 调用 。 我 们 将 在 
28.1 节 讨 论 CORBA。 

m Thrift 协议 和 框架 ， 主 要 用 于 社交 网 站 Facebook. 

发 布 / 订 阅 : 一 种 异步 的 消息 通信 协议 ， 订 阅 者 订阅 由 发 布 者 发 布 的 消息 。 消 息 可 被 

分 类 。 订 阅 者 表达 他 感 兴趣 的 一 或 多 个 类 别 ， 并 只 接收 感 兴趣 的 消息 而 不 用 关心 发 

布 者 在 哪儿 。 不 将 订阅 者 与 发 布 者 绑 定 能 增强 可 扩展 性 并 允许 更 动态 的 网 络 拓扑 结 

构 。 发 布 / 订 阅 中 间 件 的 例子 有 TIBCO 软件 公司 的 TIBCO Rendevous 和 ZeroC 公司 

的 Ice(Internet Communications Engine). 

面向 消息 中 间 件 (MOM) : BER Pig EARS ASE PE, A CE AP dim ATR 

PaM FAP AA. “4 A oh AEC RAE, ARAL DUI AIA. TH 

场 上 有 多 种 MOM 产品 ， 如 IBM 的 WebSphere MQ, MSMQ (微软 的 Message Queuing ) 

Ail JMS (Java Messaging Service), JMS 是 JEE 的 一 部 分 ， 帮 助 开发 可 移植 、 基 

于 消息 的 Java 应 用 。MOM 产品 还 包括 实现 了 JMS 的 Sun Java System Message 

Queue(SJSMQ) 和 Oracle 公司 的 MessageQ。 

对 象 请 求 代理 (ORB): 负责 管理 对 象 之 间 的 通信 和 数据 交换 。ORB 允许 开发 者 通过 

集成 对 象 来 构建 系统 ， 这 些 对 象 可 以 来 自 不 同 的 提供 商 ， 但 通过 ORB 可 互相 通信 ， 

从 而 促进 分 布 式 对 象 系统 的 互 操作 性 。 公 共 对 象 请 求 代 理 结构 (CORBA) 是 对 象 管 

HHH (OMG) 推出 的 标准 ， 它 使 得 用 多 种 计算 机 语言 写 的 、 在 不 同 机 融 上 运行 的 软 

组 件 能 协同 工作 。 商 品 化 ORB 的 例子 有 Progress Software 公司 的 Orbix。 

面向 SQL 数据 访问 : 能 跨 网 络 连 接 数 据 库 应 用 ， 把 SQL 请 求 转换 为 本 地 SQL 或 其 

他 数据 库 语 言 表 达 。 面 向 SQL 的 中 间 件 不 再 需要 为 每 个 数据 库 编 写 专门 的 SQL 调用 

代码 ， 也 不 再 需要 为 基本 的 通信 编写 代码 。 更 通常 的 情况 是 ， 面 向 SQL 的 中 间 件 能 

将 应 用 连接 到 任何 类 型 的 数据 库 (尽管 用 SQL, 但 不 必 一 定 是 关系 型 DBMS)。 该 类 
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中 间 件 的 例子 有 微软 的 开放 数据 库 互 连 (Open Database Connectivity, ODBC)API, € 
暴露 单一 接口 以 简化 用 户 访 问 数据 库 ， 而 自己 通过 使 用 驱动 程序 适 配 不 同 数据 库 间 
的 差异 。 还 有 JDBC API， 它 用 单一 一 组 方法 来 简化 对 多 个 数据 库 的 访问 。 我 们 把 
网 关 也 包括 在 这 类 中 间 件 中 ， 它 在 分 布 式 DBMS 中 像 个 中 介 ， 把 一 种 语言 或 方言 翻 
译 成 男 一 种 语言 或 方言 (例如 ， 将 Oracle 的 SQL 翻 成 IBM DB2 的 SQL， 或 把 微软 
SQL Server 的 SQL 翻 成 对 象 查询 语言 (Object Query Language，OQL)。 我 们 将 在 第 
24 章 讨论 网 关 ， 在 第 29 章 讨论 ODBC 和 JDBC. 
下 节 我 们 考察 专用 于 事务 处 理 的 中 间 件 。 


3.1.7 事务 处 理 监 视 器 


事务 处 理 (TP) 监视 器 | 控制 客户 端 和 服务 器 之 间 数 据 传 输 的 程序 ， 旨 在 为 应 用 提供 一 致 
的 环境 ， 尤 其 是 为 联机 事务 处 理 (OLTP) 一 类 的 应 用 。 


复杂 的 应 用 程序 经 常 建立 在 多 个 资源 管理 器 (例如 DBMS、 操 作 系 统 、 用 户 接 口 及 通 
信和 软件 ) 之 上 。TP 监视 右 是 一 个 中 间 件 ， 能 访问 各 种 资源 管理 器 提供 的 服务 ， 同 时 为 事务 
型 软件 的 开发 者 提供 一 个 统一 的 接口 。TP 监视 顺 作 为 三 层 结构 中 的 中 间 层 ， 如 图 3-8 所 示 。 
TP 监视 名 具有 很 多 优点 ， 包 括 : 


zj 一 服务 调用 





服务 端 带 TP 监 视 器 的 应 用 服务 器 数据库 服 务 器 
层 1 层 2 层 3 
图 3-8 ”事务 处 理 监视 器 作为 三 层 结 构 中 的 中 间 层 


e 事务 路 由 : TP 监视 器 可 以 通过 将 事务 分 配 到 特定 的 DBMS 扩大 系统 规模 。 

© 管理 分 布 式 的 事务 : TP 监视 器 可 以 管理 这 样 的 事务 ， 它 们 要 求 访 问 存储 在 不 同 甚至 
异 构 DBMS 上 的 数据 。 例 如 ， 一 个 事务 要 求 更 新 的 数据 项 可 能 分 别 存储 在 站 点 1 的 
Oracle DBMS 中 、 站 点 2 的 Informix DBMS 中 和 站 点 3 的 IMS DBMS 中 。TP 监视 
需 通 常 使 用 X/Open 分 布 式 事务 处 理 (Distributed Transaction Processing, DTP) 标准 
来 控制 事务 。 任 何 支持 这 个 标准 的 DBMS 均 可 以 作为 资源 管理 器 ， 在 充当 事务 管理 
器 的 TP 监视 器 的 控制 下 工作 。 第 24 ~ 25 章 将 讨论 分 布 式 事务 和 DTP 标准 。 

© 负载 平衡 : TP 监视 需 可 在 运行 于 一 个 或 多 个 计算 机 上 的 多 DBMS 间 平 衡 客 户 请 求 ， 
即将 客户 请 求 分 配 到 负载 最 轻 的 服务 器 上 。 另 外 ， 它 还 可 以 动态 引进 DBMS ， 以 满 
足 必 要 的 性 能 需要 。 

e 漏斗 效应 : 在 具有 大 量 用 户 的 环境 中 ， 让 所 有 的 用 户 同时 登录 到 DBMS 可 能 有 困难 。 
其 实在 大 多 数 情 况 下 ， 用 户 并 不 需要 连续 不 断 地 访问 DBMS。 因 此 ，TP 监视 器 可 以 


50 P-R # F 


在 需要 的 时 候 与 DBMS ÈVE, J EAA E E R A A TF] DBMS 
中 ， 而 不 是 将 每 一 个 用 户 都 与 DBMS 相连 。 这 样 一 来 ， 大 量 用 户 使 用 少量 连接 即 可 
访问 DBMS， 这 也 意味 着 DBMS 的 资源 耗费 较 低 。 
o 增强 可 靠 性 : TP 监视 器 充当 一 个 事务 管理 器 ， 执 行 维护 数据 库 一 致 性 的 必要 动作 ， 
而 DBMS 充当 资源 管理 器 。 如 果 DBMS 失效 ，TP 监视 器 能 够 将 事务 提交 给 另外 一 
个 DBMS, 或 者 保持 事务 直到 DBMS 再 次 可 用 。 
TP 监视 右 通 常用 在 具有 大 量 事务 的 环境 中 ， 在 这 里 TP 监视 项 可 以 用 来 从 DBMS 服务 
器 上 印 载 进程 。 比 较 典 型 的 TP 监视 器 的 例子 包括 CISC (主要 用 于 z/OS 或 zVSE 下 的 IBM 
大 型 机 ) 和 Oracle 公司 的 Tuxedo。 此 外 ，Java 事务 API (Java Transaction API， 即 JTA， 属 
于 Java 企业 版 API 的 一 种 ) 也 使 得 分 布 式 事务 能 在 Java 环境 下 跨 多 个 X/Open XA 资源 运 
行 。JTA 开放 源码 的 实现 有 红 帽 的 JBoss TS, 它 曾 叫 作 Arjuma 事务 服务 (Arjuma Transaction 
Service), LAX Bitronix 的 Bitronix 事务 管理 毅 (Bitronix Transaction Manager)。 


3.2 Web 服务 与 面向 服务 的 结构 
3.2.1 Web 服务 


| Web 服务 | 一 种 软件 系统 ， 用 于 支持 跨 网 络 且 可 互 操 作 的 机 器 与 机 器 之 间 的 交互 。 


虽然 Internet 的 概念 出 现 不 过 20 年 ， 但 在 这 么 一 个 相对 较 短 的 时 间 里 它 几 乎 改变 了 
社会 的 方方面面 ,包括 企业 、 政 府 、 广 播 、 商 业 、 娱 乐 、 通 信 、 教 育 和 培训 ， 等 等 。 尽 管 
Internet 已 使 公司 能 为 其 用 户 提供 形形色色 ， 有 时 称 为 B2C (企业 对 消费 者 ) 的 服务 ， 但 
Web 服务 能 允许 应 用 跨 Internet 与 其 他 应 用 集成 ， 这 可 能 就 是 支持 B2B (企业 对 企业 ) 集成 
的 关键 技术 。 

不 像 其 他 基于 Web 的 应 用 ，Web 服务 没有 用 户 界面 ， 也 不 针对 Web X w tr. A, 
Web 服务 通过 其 编程 接口 跨 网 络 共 享 的 是 业务 逻辑 、 数 据 和 进程 。 因 此 ， 与 它 接 口 的 是 应 用 
而 不 是 用 户 。 开 发 者 只 要 把 一 个 Web 服务 加 到 Web 页 面 (或 一 个 可 执行 程序 ) 中 即 可 为 用 
户 提 供 一 项 特殊 功能 。Web 服务 的 例子 有 : 

è Microsoft Bing Maps 和 Google Maps， 这 些 Web 服务 提供 基于 位 置 访问 的 服务 ， 如 

地 图 、 导 航 、 邻 近 搜 索 和 地 址 变 坐标 或 坐标 变 地 址 等 。 

e Amazon Simple Storage Service (Amazon S3 ) 是 一 个 简单 的 Web 服务 接口 ， 能 用 于 
在 任意 时 候 从 网 上 任何 地 方 存储 或 检索 大 量 数据 。 任 何 开 发 者 都 能 访问 这 些 Amazon 
公司 自己 也 在 使 用 的 高 可 扩展 、 可 靠 、 快 速 、 廉 价 的 数据 存储 设施 。 费 用 按 现 收 现 
fs} (pay-as-you-go) 的 原则 ， 当 前 的 价格 是 每 月 前 50TB 收费 0.125 美元 /GB。 
Geoname 提供 铬 干 与 位 置 相关 的 Web 服务 。 例 如 ， 给 定 地 名 返回 用 XML 文档 描述 
的 一 组 维基 百科 条 目 ， 或 给 定 经 纬度 返回 时 区 等 。 

e 来 自 Service Object 公司 的 DOTS 作为 较 早 的 Web 服务 ， 可 提供 一 系列 服务 。 如 公 
司 基本 信息 、 反 查 电话 号 码 、Email 地 址 确认 、 天 气 信 息 和 根据 IP 地 址 确定 位 置 等 。 
Xignite 是 B2B 的 Web 服务 ， 它 允许 公司 在 其 应 用 中 加 入 财经 信息 ,包括 美国 股市 
行情 、 实 时 交易 价格 和 财经 新 闻 等 。 

Web 服务 成 功 的 关键 是 使 用 了 被 广泛 接受 的 一 系列 技术 和 标准 ， 如 : 
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© XML (可 扩展 标记 语言 )。 
© SOAP (简单 对 象 访问 协议 ) 是 在 Internet 上 交换 结构 化 信息 的 通信 协议 ， 使 用 基于 
XML 的 消息 格式 ， 既 独立 于 平台 又 与 语言 无 关 。 
© WSDL(Web 服务 摘 述 语言 ) 协议 ， 也 是 基于 XML 的 ， 它 用 于 摘 述 和 和 定位 Web 服务 。 
e UDDI( 通 用 发 现 、 摘 述 和 集成 ) 协议 是 独立 于 平台 、 基 于 XML 的 一 种 注册 目录 ， 
企业 可 将 其 在 网 上 提供 的 服务 列 出 来 。 该 注册 目录 可 用 SOAP 消息 查询 ， 还 可 访问 
WSDL 文档 ， 文 档 给 出 要 与 注册 目录 中 的 Web 服务 交互 需 遵守 的 协议 和 消息 格式 。 
图 3-9 展示 了 这 些 技术 间 的 关系 。 从 数据 库 的 角度 看 ，Web 服务 既 能 在 数据 库 内 用 到 
(数据 库 作 为 消费 者 ， 采 用 外 部 Web 服务 )， 也 可 能 访问 它 自己 的 数据 库 (此 时 数据 库 作 为 提 
供 者 )， 该 数据 库 专 门 管理 提供 服务 时 所 要 求 的 数据 。 





图 3-9 WSDL、UDDI 和 SOAP 三 者 的 关系 


RESTful Web 服务 

Web API 是 Web 服务 的 发 展 ， 它 从 强调 基于 SOAP 的 服务 转 为 基于 表示 状态 转换 (Repres- 
entational State Transfer, REST). REST kk 4 A #4325 XML, SOAP, WSDL sk UDDI ¥ X., 
REST 是 一 种 构建 方式 ， 它 说 明 约 束 ， 比 如 统一 界面 ， 将 其 用 于 Web 服务 可 获得 高 性 能 、 可 
伸缩 性 和 可 修改 性 等 期 望 的 特性 , 这 将 使 服务 在 Web 上 工作 得 更 有 效 。 用 REST 这 种 构建 方 
式 ， 数 据 和 功能 都 被 视 为 资源 ， 能 用 统一 资源 标识 ( Uniform Resource Identifiers, URI) 访问 ， 
就 像 通常 的 Web 链接 。 资 源 能 用 PUT、GET、POST 和 DELETE 这 样 一 组 简单 且 定 义 良好 
的 操作 ， 来 完成 创建 、 读 取 、 修 改 和 删除 。PUT 创建 一 个 新 资源 ， 然 后 可 用 DELETE 删除 。 
GET 检索 用 某 种 方式 表示 的 资源 的 当前 状态 。POST 转换 资源 为 一 个 新 状态 。 

REST 采用 客户 - 服务 器 结构 ， 并 使 用 无 状态 通信 协议 ,通常 是 HTTP。 用 REST 这 种 
构建 方式 时 ， 客 户 端 和 服务 器 用 标准 的 接口 和 协议 交换 资源 的 表示 。 

29.2.5 节 将 讨论 Web 服务 、HTML 和 URI， 第 29 ~ 30 章 讨论 SOAP, WSDL 和 UDDI。 


3.2.2 面向 服务 的 结构 (SOA) 


SOA | 一 种 以 业务 为 中 心 构造 应 用 的 软件 结构 ， 它 用 已 发 布 的 一 组 服务 来 实现 业务 过 程 ， 
服务 的 粒度 与 消费 者 有 关 。 这 些 服务 无 论 是 被 使 用 、 被 发 布 和 被 发 现 ， 还 是 从 某 个 具体 实 
现 中 被 抽取 出 来 ， 都 采用 基于 单一 标准 形式 的 界面 。 
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在 今天 这 样 一 个 IT 给 了 企业 从 未 有 过 的 机 会 ， 而 技术 本 喘 又 在 不 断 发 展 的 时 代 ， 灵 活 
性 被 认为 是 企业 的 关键 需求 。 可 重用 性 被 看 作 软 件 开 发 的 主要 目标 ， 因 而 面向 对 象 范 型 被 广 
泛 接受 : 面向 对 象 的 程序 设计 过 程 可 视 为 确定 一 组 互 操作 的 对 象 ， 而 不 是 像 传统 编程 那样 确 
定 一 组 需 计算 的 任务 。 在 OOP 中 ， 每 个 对 象 都 能 接收 消息 、 处 理 数据 、 传 送 消息 给 其 他 
对 象 。 在 传统 的 IT 结构 中 ， 各 个 业务 处 理 活 动 、 应 用 和 数据 都 各 自 为 政 ， 像 一 口 口 意 立 
的 发 射 井 ， 用 户 不 得 不 在 这 些 网 络 、 应 用 和 数据 库 中 导航 以 完成 整个 业务 处 理 活 动 链 。 而 
上 且 ， 每 个 独立 的 发 射 井 都 要 消耗 大 量 的 经 费 ， 并 需 耗 时 维护 。 图 3-10a 展示 了 按 这 种 结构 
组 织 的 三 个 过 程 ， 即 服务 调度 、 订 单 处 理 和 账户 管理 ， 每 个 过 程 都 涉及 若干 数据 库 。 很 明 
显 ， 在 这 些 活动 中 有 一 些 公共 的 服务 ， 每 个 过 程 都 会 用 到 它们 。 试 想 ， 如 果 企 业 的 需求 发 
生变 化 ， 或 者 出 现 新 的 商机 ， 由 于 这 些 过 程 之 间 缺 乏 独 立 性 ， 就 很 难 修改 茶 个 过 程 以 适应 
发 生 的 变动 。 

SOA 正 是 为 解决 这 个 问题 而 提出 的 ， 它 设计 了 一 组 松散 耦合 的 目 治 服务 ， 通 过 组 合 它 
们 来 提供 灵活 、 复 杂 的 业务 过 程 和 应 用 。 图 3-10b 说 明了 如 何 采 用 SOA 重 构 同一 个 业务 
过 程 。 
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a) 按 传 统 IT 结 构 组 织 的 三 个 业务 过 程 b) 面向 服务 的 结构 将 过 程 分 割 成 若干 可 重用 的 服务 
图 3-10 

因此 ， 服 务 的 本 质 区 别 在 于 ， 服 务 的 提供 独立 于 使 用 这 个 服务 的 应 用 。 服 务 提 供 者 可 开 
发 特定 的 服务 ， 并 提供 给 分 布 在 不 同 组 织 机 构 内 的 用 户 使 用 。 而 构建 应 用 就 是 通过 标准 程序 
设计 语言 或 专用 的 服务 编排 语言 (如 BPEL，Business Process Execution Language) 将 这 些 
来 自 不 同 提供 者 的 服务 链接 到 一 起 。 

为 SOA 设计 的 Web 服务 不 同 于 其 他 Web 服务 之 处 在 于 ， 它 们 通常 须 遵守 若干 约定 。 
下 面 是 一 组 公共 的 SOA 守则 ， 它 提供 了 设计 SOA 专用 Web 服务 的 方法 。 

e PSS: 服务 之 间 的 交互 应 设计 为 松 耦 合 的 。 

ef: 凡 存 在 潜在 重用 性 的 逻辑 都 应 设计 为 单独 的 服务 。 
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e 24; 服务 附着 一 个 通信 契约 ， 该 契约 定义 信息 交换 和 由 一 份 或 多 份 服务 描述 文档 
指定 的 任何 附加 的 服务 描述 信息 。 

e 抽象 : 除了 在 服务 契约 中 描述 的 内 容 ， 服 务 对 外 隐藏 其 内 部 逻辑 。 

e 可 组 合 性 : 服务 可 与 其 他 服务 组 合 以 构成 不 同 粒度 的 业务 逻辑 ， 从 而 提供 可 重用 性 
和 不 同 的 抽象 层次 。 

© 自治 : 一 个 服务 不 需 依赖 其 他 服务 就 能 控制 其 封装 的 逻辑 。 

© 无 状态 : 服务 不 应 要 求 维护 状态 信息 ， 和 否则 影响 其 松 耦 合 特性 。 

© 可 发 现 性 : 服务 应 设计 成 对 外 可 描述 的 ， 使 得 通过 合适 的 发 现 机 制 即 可 发 现 和 访问 
服务 。 

注意 ，SOA 并 不 局 限于 Web 服务 ， 亦 可 用 于 其 他 技术 范畴 。SOA 进一步 的 讨论 已 超出 

本 书 的 范围 ， 感 兴趣 的 读者 可 参考 列 在 书后 的 有 关 本 章 的 读物 。 


3.3 ”分布 式 DBMS 


正 像 第 1 章 讨论 的 那样 ， 推 动 数据 库 系统 发 展 的 主要 因素 是 ， 人 们 希望 集成 一 个 组 织 机 
构 内 所 有 操作 数据 并 能 对 数据 进行 受 控 的 访问 。 尽 管 我 们 可 以 认为 集成 和 受 控 访问 意味 着 集 
中 管理 ， 但 其 实 这 并 不 是 必需 的 。 实 际 上 ， 计 算 机 网 络 的 发 展 促进 了 分 散 式 的 作业 模式 。 这 
种 分 散 的 方法 反映 了 许多 公司 的 组 织 结构 ， 即 逻辑 上 被 分 成 多 个 分 公司 、 部 门 、 项 目 ， 物 理 
上 分 为 办 公 室 、 车 间 、 工 厂 ， 每 一 个 小 单位 都 维护 着 目 己 的 操作 数据 。 开 发 反映 上 述 组 织 结 
构 的 分 布 式 数据 库 系统 可 使 得 数据 对 每 个 单位 都 是 可 访问 的 ， 并 能 将 数据 就 近 存 放 于 最 常用 
的 位 置 ， 这 样 一 来 ， 可 望 提高 数据 的 共享 程度 和 数据 访问 效率 。 


分 布 式 数据 库 | 物理 分 布 于 计算 机 网 络 上 ， 但 逻辑 相互 关联 的 共享 数据 (和 数据 描述 ) 的 
集合 。 


| 分 布 式 DBMS | 管理 分 布 式 数据 库 并 对 用 户 提 供 分 布 透 明 性 的 软件 系统 。 


分 布 式 数据 库 管 理 系统 (DDBMS) 由 一 个 被 分 为 多 段 的 逻辑 数据 库 构 成 。 每 段 都 在 一 
个 单独 的 DBMS 控制 下 ， 存 储 在 一 台 或 多 台 (存在 复制 ) 计算 机 上 ， 这 些 计算 机 都 通过 网 络 
互联 起 来 。 每 一 个 站 点 都 可 以 独立 地 处 理 用 户 提出 的 访问 本 地 数据 的 请 求 ( 即 每 个 站 点 都 有 
一 定 的 本 地 自主 性 )， 同 时 还 可 以 处 理 存 储 在 网 络 上 其 他 计算 机 中 数据 。 

用 户 通过 应 用 来 访问 分 布 式 数据 库 中 的 数据 。 应 用 分 为 不 需要 从 其 他 站 点 获得 数据 的 应 
用 (本 地 应 用 ) 和 需要 从 其 他 站 点 获得 数据 的 应 用 (全 局 应 用 )。 一 般 DDBMS 至 少 需 包 含 一 
个 全 局 应 用 。 因 此 ，DDBMS 应 当 具 有 如 下 特征 : 

。 逻辑 上 相关 的 共享 数据 的 集合 
TE BD MA T Et 
段 可 能 被 复制 
段 /副本 分 配 在 各 个 站 点 上 
站 点 由 通信 网 络 连接 起 来 
每 个 站 点 的 数据 都 在 一 个 DBMS 控制 下 
每 个 站 点 上 的 DBMS 都 能 自主 地 处 理 本 地 应 用 
每 个 DBMS 至 少 参与 一 个 全 局 应 用 
并 非 系统 中 每 个 站 点 都 必须 有 自己 的 本 地 数据 库 ， 图 3-11 显示 了 一 个 DDBMS 的 拓扑 结构 。 
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图 3-11 分布 式 数据 库 管 理 系统 


从 DDBMS 的 定义 中 可 以 看 出 ， 系 统 期 望 对 于 用 户 来 讲 分 布 具有 透明 性 〈 即 不 可 见 的 )。 
这 样 ， 用 户 就 不 需要 知道 分 布 式 数据 库 如 何 分 段 存 储 在 多 个 不 同 计算 机 上 ， 以 及 如 何 被 复制 
等 细节 。 提 供 透 明 性 的 目的 就 是 使 用 户 像 使 用 集中 式 系统 那样 使 用 分 布 式 系 统 。 这 常常 被 称 
为 DDBMS 的 基本 原则 。 这 个 需求 为 终端 用 户 提供 了 强大 的 功能 ， 但 它 同时 也 产生 了 许多 需 


要 DDBMS 解决 的 问题 。 
分 布 式 处 理 


将 分 布 式 DBMS 与 分 布 式 处 理 区 分 开 来 是 很 重要 的 。 


| 分 布 式 处 理 | 一 个 可 以 通过 计算 机 网 络 来 访问 的 集中 式 数据 库 。 


分 布 式 DBMS 定义 的 关键 点 在 于 该 系统 
是 由 物理 上 分 布 于 网 络 各 个 站 点 上 的 数据 构 
成 的 。 如 果 数 据 集中 ， 即 使 其 他 用 户 可 以 通 
过 网 络 来 访问 这 些 数据 ， 仍 然 不 能 认为 它 是 
一 个 分 布 式 DBMS， 而 仅仅 是 分 布 式 处 理 而 
已 。 图 3-12 说 明了 分 布 式 处 理 的 拓扑 结构 。 


比较 图 3-11 与 图 3-12， 可 以 看 出 图 3-12 中 的 f 4 
站 点 2 上 有 一 个 集中 式 数 据 库 ， 而 图 3-11 中 
多 个 站 点 都 有 自己 的 数据 库 (DB)。 我 们 将 在 | 


第 24 一 25 章 深 入 讨论 分 布 式 DBMS. 


3.4 数据 仓库 


A 20 世纪 70 年 代 以 来 ， 很 多 企业 都 将 
投资 集中 在 新 型 的 能 将 业务 流程 自动 化 的 系 
统 ( 称 为 联机 事务 处 理 或 OLTP) ko 希望 据 


站 点 1 





图 3-12 “分 布 式 处 理 
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此 为 客户 提供 更 为 高 效 和 经 济 的 服务 ， 使 企业 更 具 欧 和 争 优势 。 这 么 多 年 过 去 了 ， 企 业 积累 了 
大 量 并 且 还 在 不 断 增 长 的 数据 ， 它 们 都 存储 在 操作 数据 库 中 。 现 在 ， 这 种 系统 已 经 变 得 相当 
普遍 ， 企 业 又 开始 将 目光 转向 使 用 这 些 操作 数据 进行 决策 分 析 ， 以 求 更 具 竞 争 力 。 

以 往 操 作 型 系统 在 设计 与 开发 时 没有 考虑 到 决策 分 析 的 需求 ， 所 以 直接 在 这 种 系统 上 进 
行 决策 分 析 并 不 适合 。 典 型 的 情形 是 ,企业 可 能 包含 了 多 种 操作 型 系统 ， 里 面 存在 一 些 重 侠 
甚至 相悖 的 定义 ， 例 如 数据 类 型 。 因 此 ， 需 要 把 这 些 归 档 数据 转换 成 知识 源 ， 给 用 户 提供 一 
个 关于 组 织 机 构 单 一 、 完 整 的 数据 视图 。 数 据 仓库 的 概念 正 是 为 满足 这 一 需求 而 提出 的 ， 即 
数据 仓库 是 能 从 多 个 操作 型 数据 源 中 获取 数据 以 支持 决策 分 析 的 系统 。 


数据 仓库 | 从 不 同 数据 源 抽 取 数 据 构 成 的 公共 数据 的 一 组 固定 /集成 的 视图 ， 加 上 一 组 终端 
访问 工具 ， 能 用 于 从 简 到 繁 的 各 类 查询 以 支持 决策 分 析 。 


数据 仓库 中 的 数据 被 描述 为 面向 主题 、 集 成 、 时 变 和 非 易 失 的 (Inmon，1993 )。 

® 面向 主题 的 。 数 据 仓库 是 围绕 企业 的 主题 (比如 客户 、 产 品 、 销 售 等 ) 而 不 是 应 用 领 ， 
域 (比如 客户 货品 计价 、 股 票 控 制 、 产 品 销售 等 ) 进行 组 织 的 。 这 是 因为 数据 仓库 中 
存储 的 是 用 于 决策 分 析 的 数据 而 不 是 面向 应 用 的 数据 。 

e 集成 的 。 数 据 仓 库 的 数据 来 源 于 组 织 机 构 内 各 种 不 同 的 应 用 系统 。 源 数据 经 常 存在 
不 一 致 的 问题 ， 比 如 使 用 不 同 的 数据 类 型 或 格式 。 被 集成 的 数据 源 必 须要 一 致 化 ， 
以 便 给 用 户 提供 一 个 统一 的 数据 视图 。 

e 时 变 的 。 数 据 仓 库 中 的 数据 只 在 某 个 时 刻 或 某 段 时 间 间 隔 内 是 精确 和 有 效 的 。 

© 非 另 失 的 。 数 据 并 不 进行 实时 更 新 ， 而 是 定时 从 操作 型 系统 中 刷新 。 新 的 数据 总 是 
对 数据 仓库 做 追加 ， 而 不 是 取代 。 

数据 仓库 的 典型 结构 如 图 3-13 所 示 。 


Mi 





操作 型 数据 源 n 数据 挖 气 工 具 







终端 用 户 
访问 工具 


操作 型 数据 存储 备份 和 归档 数据 
图 3-13 ”数据 仓库 的 典型 结构 


对 数据 仓库 ， 操 作 型 数据 的 来 源 主 要 包含 大 型 机 、 专 有 文件 系统 、 私 有 工作 站 和 服务 
做， 以 及 如 Internet 之 类 的 外 部 系统 。 操 作 型 数据 存储 (Operatonal Data Store, ODS) 中 储 
存 着 当前 和 集成 的 操作 数据 ， 供 分 析 用 。 尽 管 它 的 结构 及 提供 数据 的 方式 一 般 与 数据 仓库 相 
同 , 但 它 只 是 操作 型 数据 进入 数据 仓库 之 前 的 一 个 等 待 区 。 加 载 管理 器 执行 所 有 与 数据 提取 
和 六 入 数据 仓库 相关 的 操作 。 仓 库 管 理 器 执行 所 有 与 数据 管理 相关 的 操作 ， 如 源 数 据 的 转换 
和 归并 、 基 表 上 索引 和 视图 的 创建 、 产 生 聚 集 数据 、 备 份 和 归档 数据 等 。 查 询 管 理 器 执行 数 
据 仓 库 中 所 有 与 用 户 查 询 管理 相关 的 操作 。 细 节 数 据 不 一 定 都 联机 存放 ， 一 般 只 能 看 到 汇总 
到 一 定 层次 后 的 数据 。 但 是 常 规 而 言 ， 细 节 数 据 要 加 入 数据 仓库 以 补充 汇总 数据 。 数 据 仓库 
中 存储 了 许多 由 仓库 管理 器 产生 的 预定 义 的 轻 度 或 高 度 汇 总 数据 。 存 储 汇总 数据 的 目的 是 加 
快 查询 速度 。 一 开始 汇总 数据 时 的 操作 开销 因 避 免 了 后 续 汇 总 操作 〈 如 排序 或 分 组 ) 而 得 到 
补偿 。 这 些 汇 总 数据 随 着 新 数据 的 加 载 而 需 不 断 更 新 。 细 节 数 据 和 汇总 数据 为 了 备份 和 归档 
也 需 离 线 存储 。 元 数据 (关于 数据 的 数据 ) 的 定义 被 数据 仓库 中 的 所 有 过 程 用 到 ， 包 括 数据 
抽取 和 加 载 过 程 、 数 据 仓 库 管 理 过 程 ， 它 同时 作为 查询 管理 过 程 的 一 部 分 。 

数据 仓库 的 主要 用 途 是 为 企业 用 户 提供 决策 支持 信息 。 这 些 用 户 通过 终端 用 户 访问 工具 
与 数据 仓库 交互 。 数 据 仓 库 必 须 有 效 地 支持 即席 查询 、 例 行 分 析 以 及 更 复杂 的 数据 分 析 。 终 
并 用 户 访问 工具 通常 包括 报表 和 查询 工具 、 应 用 程序 开发 工具 、 可 执行 信息 系统 (EIS) T 
具 、 联 机 分 析 处 理工 具 ( OLAP) 和 数据 挖掘 工具 。 我 们 将 在 第 31 ~ 34 章 深 入 讨论 数据 仓 
E, OLAP 和 数据 挖掘 工具 。 


3.5 AHWA 


云 计算 | 一 种 对 可 配置 计算 资源 池 (人 和 例如， 网络、 服务器、 存储 、 应 用 和 服务 等 ) HAM 
处 、 便 捷 、 按 需 网 络 访问 的 模式 ( model)， 并 且 这 些 计算 资源 的 获取 和 释放 都 只 需 很 少 的 
管理 成 本 或 者 只 需 与 服务 提供 商 进 行 很 少 的 交互 (NIST, 2011)®, 


云 计 算 这 个 术语 描述 了 在 数字 网 络 上 使 用 多 台 服 务 器 就 好 像 是 用 一 台 计 算 机 一 样 。 云 即 
为 资源 一 一 网 络 、 服 务 器 、 应 用 、 数 据 存储 和 服务 的 虚拟 化 ， 终 端 用 户 按 需 访问 它 。 虚 拟 化 
就 是 产生 某 种 资源 的 虚拟 版 本 ， 比 如 服务 器 、 操 作 系 统 、 存 储 设备 或 网 络 等 。 虚 拟 化 的 目的 
是 提供 这 些 资源 时 只 需 很 少 的 管理 成 本 或 者 只 需 与 服务 提供 商 进行 很 少 的 交互 。 云 计算 在 为 
用 户 提 供 服 务 时 不 要 求 用 户 知 晓 提供 服务 的 系统 或 该 系统 的 位 置 。 此 外 ， 云 能 为 用 户 提供 各 
种 应 用 和 服务 。 因 此 ， 云 的 目标 就 是 为 用 户 和 企业 提供 可 伸缩 、 可 裁剪 的 服务 。 
NIST 认为 云 模式 由 五 条 基本 特征 、 三 种 服务 模式 和 四 类 部 署 模式 构成 。 基 本 特征 包括 : 
e 按 需 自 服务 (on-demand self-servier)。 消 费 者 根据 云 服 务 目录 自己 就 能 获得 、 配 置 
和 部 署 云 服 务 ， 而 无 需 云 提供 者 的 任何 帮助 。 
e 网 络 广 泛 可 访问 。 云 计算 最 关键 的 特性 是 基于 网 络 ， 从 任何 地 方 的 任何 标准 平台 
(例如 ,台式 机 、 笔 记 本 或 移动 终端 ) 都 可 访问 它 。 
e 资源 池 。 云 计算 资源 的 提供 者 将 资源 放 人 入 池 中 为 多 个 消费 者 服务 ， 即 按 消费 者 的 需 
求 动 态 地 分 配 或 再 分 配 物理 或 虚拟 的 资源 。 
o 急速 弹性 。 资源 池 已 避免 了 构建 更 大 的 网 络 和 计算 基础 设施 这 个 主要 开销 。 消费 者 
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可 通过 回 云 付费 ， 立 即 获 得 云 提 供 的 某 种 计算 能 力 ， 以 满足 其 一 些 特殊 或 突 发 的 需 
求 ， 从 而 极 大 地 减少 了 停顿 业务 或 中 断 服 务 的 风险 。 而 且 这 些 计 算 能 力 能 有 弹性 地 
提供 或 释放 ， 有 时 甚至 是 自动 地 调节 到 消费 者 需要 的 程度 。 

服务 度量 。 云 系统 通过 调 记 测量 能 力 与 服务 类 型 (例如 ， 存 储 、 处 理 、 带 宽 和 活 牙 
用 户 账户 ) 的 适合 度 来 自动 控制 和 优化 资源 使 用 。 也 就 是 说 资源 使 用 能 被 监控 、 控 
制 和 收费 。 


NIST 设计 的 三 种 服务 模式 如 下 : 


软件 即 服 务 ( Software as a Service，SaaS )。 软 件 及 相关 联 的 数据 都 集中 放 在 云 上 。 
SaaS 通常 可 从 各 种 客户 端 设备 通过 一 个 客户 端 界面 访问 ， 例 如 Web 浏览 器 。 消 费 者 不 
用 管理 和 控制 基本 的 云 设 施 ， 除 了 有 时 可 能 要 对 用 户 特 定 应 用 配置 进行 有 限 的 控制 。 可 
将 SaaS 看 作 是 最 老 、 最 成 熟 的 一 类 云 计算 。SaaS 的 实例 包括 销售 管理 应 用 salesforce. 
com、 集 成 业务 管理 软件 NetSuite, Google 的 Gmail 和 Cornerstone OnDemand, 

平台 即 服务 (Platform as a Service, PaaS), PaaS 是 一 种 计算 平台 ， 它 支持 在 其 上 
快速 、 方 便 地 创建 Web 应 用 ， 而 无 需 购 买 和 维护 该 应 用 之 下 的 软件 和 基础 设施 。 有 
时 也 在 PaaS 上 扩展 应 用 程序 而 演变 成 SaaS。 原 来 开发 一 个 应 用 要 考虑 硬件 、 操 作 
系统 、 数 据 库 、 中 间 件 、Web 服务 器 和 其 他 软件 ， 而 用 PaaS 模式 只 需 考 虑 如 何 集 
成 它们 ， 剩 下 的 是 PaaS 提供 商 的 事 。PaaS 实例 包括 salesforce.com 的 Force.com, 
Google 的 APP Engine 和 微软 的 Azure。 消 费 者 不 用 管理 和 控制 的 基本 云 设 施 包括 网 
络 、 操 作 系 统 、 存 储 ， 但 对 部 署 的 应 用 有 时 还 要 管理 其 所 处 环境 的 配置 。 

基础 设施 即 服务 (Infrastructure as a Service, IaaS). laas 将 服务 器 、 存 储 、 网 络 和 
操作 系统 打包 作为 一 个 可 按 需 请 求 的 服务 提交 给 消费 者 ， 通 常 是 一 个 虚拟 的 平台 环 
境 ， 按 使 用 情况 付费 。 对 于 某 些 大 型 Web 网 站 ， 它 内 部 的 基础 设施 并 不 是 为 实现 
laas 而 构建 的 ， 但 这 些 设施 在 完成 本 身 的 业务 外 还 有 空余 可 提供 给 外 界 用 ， 这 就 是 
目前 流行 的 IaaS。 亚 马 逊 的 Elastic Computer Cloud ( EC2 )、Rackspace 和 GoGrid 都 
是 laas 的 例子 。 除 了 操作 系统 、 存 储 及 部 署 的 应 用 外 ， 消 费 者 不 用 管理 和 控制 其 他 
基本 云 设 施 ， 当 然 ， 有 时 可 能 还 需 对 所 选 网 络 部 件 〈 例 如 防火 墙 ) 进行 控制 。 


3-14 说 明了 这 些 模 式 。 
云 的 四 类 部 署 模式 是 : 


私有 云 (Private cloud)。 云 基础 设施 仅 由 单个 组 织 机构 操 纵 ， 但 可 能 由 该 机 构 本 身 、 
第 三 方 或 它们 的 组 合 来 管理 云 。 云 可 由 内 部 拥有 也 可 由 外 部 拥有 。 

#4 HJ (Community cloud)。 云 基础 设施 由 某 个 组 织 机 构 的 社团 共享 ， 社团 内 的 成 员 
一 定 有 某 种 共识 (例如 ， 保密 需 求 、 承 诺 、 权 限 等 )， 社团 之 外 不 得 使 用 云 。 此 云 基 
础 设施 可 能 被 社团 内 一 个 或 多 个 组 织 机 构 、 第 三 方 或 它们 的 组 合 拥 有 和 管理 ， 云 可 
由 内 部 拥有 也 可 由 外 部 拥有 。 

AAA (Public cloud)。 服 务 提 供 商 使 得 云 基础 设施 对 公众 可 用 。 服 务 可 能 免费 ， 也 
可 能 按 使 用 即 付费 方式 收费 。 此 云 基础 设施 可 能 被 企业 、 学 校 、 政 府 部 门 或 它们 的 
某 种 组 合 拥 有 和 管理 。 只 有 云 提供 商 存 在 时 这 种 云 才 存在 。 通 常 ， 公 有 云 服 务 提 
供 商 (如 Amazon AWS、 微 软 和 Google 等 ) 拥有 并 操纵 云 基础 设施 ， 仅 提供 通过 
Internet 的 访问 (不 提供 直接 连接 )。 

AA (Hybird cloud)。 云 基础 设施 是 由 两 种 或 多 种 云 设施 (和 私有、 社团 或 公有 ) 组 
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合 而 成 ， 其 中 每 个 基础 设施 虽 本 身 还 是 独立 实体 ， 但 通过 标准 化 和 特别 的 技术 绑 定 
在 一 起 ， TS 
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图 3-14 全 打包 软件 、IaaS 、PaaS 、SaagS 之 间 的 差别 

云 计 算 的 好 处 与 风险 


相 比 传统 的 方法 ， 云 计算 能 为 公司 带 来 奋 干 好 处 : 
e 降低 成 本 。 云 计算 使 得 一 个 组 织 机 构 无 需 预 先 为 昂贵 的 服务 器 、 软 件 许可 和 IT 人 员 


支付 大 笔 费 用 ， 而 把 这 些 负担 都 推 给 云 提 供 商 。 这 样 一 来 ， 小 公司 可 能 买 不 起 ， 但 
却 用 得 起 那些 高 性 能 的 计算 基础 设施 。 而 且 ， 它们 只 要 为 用 到 的 机 制 付费 ， 至 于 这 
些 机 制 是 否 充分 发 挥 了 作用 就 不 必 再 操心 了 。 

可 伸缩 /灵活 。 按 需 提 供 的 机 制 使 得 组 织 机 构 能 根据 需要 配置 和 移 除 资源 。 当 组 织 
机 构 的 某 个 项 目 获 得 启动 资金 时 才 申 请 服务 ， 项 目 终止 时 立即 退出 所 占 资 源 ， 这 样 
在 业务 增长 时 不 必 为 改变 组 织 机 构 内 的 IT 系统 而 付出 昂贵 代价 。 这 也 就 是 所 谓 的 弹 
性 ， 是 亚马逊 为 Elastic Computing Cloud (EC2 ) 起 名 的 缘由 。 

改进 安全 性 。 安 全 性 能 可 与 纯 内 部 系统 相当 ， 甚 至 更 好 ， 因 为 云 提供 商 有 能 力 拿 
出 专门 的 资源 解决 安全 问题 ， 而 一 般 则 负担 不 起 。 由 于 一 个 组 织 机 构 的 所 有 数据 不 
再 存在 一 个 地 方 ， 因 此 这 种 数据 分 散 本 身 也 能 提高 安全 性 。 而 且 许 多 较 小 的 公司 也 
不 再 需要 将 资源 用 于 内 部 数据 中 心 的 审计 和 验证 等 过 程 。 声 明 遵 守 萨 班 斯 - 奥 克 
斯 利 (Sarbances-Oxley) 法 案 、 支 付 卡 行业 数据 安全 标准 (Payment Card Industry 
Data Security Standard, PCI DSS) 和 健康 保险 携带 和 责任 法 案 ( Health Insurance 
Portability and Accountability Act, HIPAA) 的 云 提供 商 ， 还 能 帮助 组 织 机 构 完 成 监 
管 并 确保 合法 运营 。 
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o 改进 可 靠 性 。 同 样 ， 云 提供 商 能 拿 出 专门 的 资源 用 于 增强 系统 的 可 靠 性 。 云 提供 商 
能 为 其 客户 提供 24/7 支持 及 高 级 的 计算 能 力 ， 而 不 需 每 个 公司 配备 专业 人 员 ， 这 使 
得 系统 更 简洁 且 更 安全 。 

o 使 用 最 新 技术 。 云 计算 有 助 于 组 织 机 构 使 用 那些 原本 买 不 起 的 最 新 的 技术 ， 包括 硬 
件 、 软 件 和 IT 功能 。 

o 快速 开发 。 云 计算 平台 提供 许多 本 来 需 公 司 自行 开发 的 核心 服务 。 有 了 这 些 服务 ， 
加 上 一 些 模板 和 工具 ， 能 显著 缩短 开发 周期 。 

© 大 规模 快速 原型 / 加载 测试 。 云 计算 使 得 大 规模 快速 原型 和 加 载 测 试 变 得 容易 。 在 
云 中 集结 1000 台 服 务 器 ， 然 后 加 载 应 用 进行 测试 ， 测 试 结 束 后 立即 释放 它们 ， 这 是 
完全 可 能 的 ， 但 若 仅 用 公司 内 部 服务 器 将 是 非常 困难 且 昂 贵 的 。 

© 更 灵活 的 工作 途径 。 云 计算 使 员工 工作 起 来 更 灵活 方便 。 员 工 能 用 任何 适 于 Web 的 
装置 访问 文件 ， 比 如 平板 电脑 、 笔 记 本 和 智能 手机 等 。 员 工 还 能 在 Internet 上 同步 共 
享 文档 和 其 他 文件 ， 有 助 于 全 局 合作 、 知 识 共享 和 组 内 共同 决策 。 

© 增强 竞争 力 。 依 托 商 品 化 的 基础 设施 和 服务 能 使 组 织 机 构 将 核心 的 开发 能 力 集中 在 
业务 市 场 ， 从 而 提高 其 竞争 力 。 

云 计算 在 给 组 织 机 构 带 来 好 处 的 同时 也 带 来 风险 : 

e 网 络 依赖 。 也 许 云 计算 最 明显 的 缺点 就 是 依赖 网 络 。 断 电 或 服务 中 断 都 将 阻碍 对 云 
设施 的 访问 。 此 外 ， 简 单 的 带宽 问题 也 会 给 云 计算 带 来 影响 ， 比 如 在 应 用 高 峰 时 段 。 
如 果 云 提供 商 的 服务 在 高 峰 时 段 是 满 负 蓓 的 ， 那 么 性 能 和 可 用 性 都 将 大 打折 扣 。 即 
使 许多 云 提 供 商 专门 留 有余 量 来 应 对 负载 高 峰 ， 还 有 其 他 不 可 预计 的 风险 、 服 务 器 
故障 或 外 部 打击 等 ， 其 中 任何 一 项 都 会 危及 云 的 客户 访问 。 

e 系统 依赖 。 一 个 组 织 机 构 可 能 高 度 依赖 云 提供 商 提 供 系统 的 可 用 性 和 可 靠 性 。 但 如 
果 该 提供 商 没 有 同时 提供 合适 的 灾难 恢复 机 制 ， 那 么 一 旦 出 问题 ， 对 该 组 织 机 构 来 
说 后 果 不 堪 设 想 。 

o 云 提供 商 依赖 。 理 想 情 况 是 ， 云 提供 商 从 不 破产 ， 也 不 会 被 更 大 的 公司 吞并 。 如 果真 发 
生 这 样 的 事情 ， 服 务 就 有 可 能 突然 终止 。 组 织 机 构 需 要 提前 做 好 预案 以 应 对 这 种 情况 。 
e 缺乏 控制 。 组 织 机 构 一 旦 将 数据 提交 到 云 提供 商 负责 管理 的 系统 后 ， 它 就 不 再 能 完 
全 控制 这 些 数据 了 ， 想 采取 一 些 技术 和 行政 的 手段 来 保护 这 些 数 据 也 不 再 可 能 。 因 

此 ,会 出 现下 面 一 系列 问题 : 

四 缺乏 可 用 性 。 如 果 云 提供 商 采 用 私有 的 技术 路 线 ， 可 以 证 明 ， 组织 机 构 很 难 在 基于 
不 同 云 的 系统 间 移 动 数据 和 文档 (数据 的 可 移植 性 ); 而 要 在 用 到 云 服 务 的 应 用 之 间 
交换 信息 ( 互 操 作 性 )， 若 这 些 服务 由 不 同 提供 商 管理 ， 同 样 也 是 困难 的 。 

e 缺乏 完整 性 。 云 由 一 组 共享 的 系统 和 基础 设施 构成 ， 云 提供 商 处 理 着 来 自 各 种 数 
据 主体 或 组 织 机 构 的 个 性 化 数据 ， 它 们 之 间 完 全 可 能 存在 利益 冲突 或 不 同 的 目的 。 

E 缺乏 机 密 性 。 在 云 中 处 理 的 数据 可 能 是 满足 执法 机 构 的 要 求 的 ， 但 因 目 前 还 没有 
健全 的 法 律 基础 ， 数 据 仍 可 能 突破 了 其 他 一 些 (外 国 的 ) 执法 机 构 的 限制 ， 从 而 
出 现 违法 行为 。 

加 缺乏 可 干预 性 。 由 于 外 包 链 的 复杂 和 动态 变化 ， 由 某 一 个 提供 商 提 供 的 云 服务 可 
能 由 其 他 多 个 提供 商 提供 的 服务 组 合 而 成 ， 并 且 该 服务 有 可 能 在 某 组 织 机 构 的 合 
同期 内 动态 地 被 加 入 或 移 除 。 此 外 ， 云 提供 商 很 可 能 没 提供 必要 的 措施 和 工具 ， 
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无 法 在 进行 访问 、 删 除 和 更 新 数据 等 操作 期 间 保 护 企业 数据 或 个 人 私有 数据 。 

加 缺乏 隔离 性 。 对 于 连接 个 人 数据 的 各 个 客户 端 发 来 的 数据 ， 云 提供 商 可 能 有 物理 的 
控制 方式 。 但 如 果 管 理 员 获得 足够 的 访问 权限 ， 他 就 能 看 到 不 同 客户 发 来 的 信息 。 

缺乏 关于 处 理 方面 的 信息 (透明 )。 由 于 不 完全 清楚 云 服务 处 理 操 作 的 细节 ， 因 此 给 

数据 控制 方 或 所 有 者 带 来 了 风险 ， 因 为 他 们 不 可 能 认识 到 潜在 的 威胁 ， 从 而 提前 采 

取 防 范 措施 。 硅 不 掌握 下 列 信息 ， 数 据 控制 方 则 可 能 承担 式 种 风险 : 

m 出 现 了 涉及 多 个 过 程 和 承包 商 的 处 理 链 。 

e 某 个 人 数据 被 放 在 不 同 的 地 理 位 置 处 理 。 这 可 能 直接 影响 到 用 户 和 提供 商 发 生 关 
于 数据 保护 的 争执 时 适用 的 法 律 条 文 。 

e 个 人 数据 被 传输 到 不 受 组 织 机 构 控 制 的 第 三 国 。 这 个 第 三 国 可 能 无 法 提供 合适 级 
别 的 数据 保护 ， 传 输 本 身 的 安全 也 未 得 到 合适 的 保护 (比如 ， 没 有 标准 的 法 律 条 
款 或 有 约束 力 的 社团 规则 )， 因 此 可 能 是 非法 的 。 


基于 云 的 数据 库 方案 


作为 SaaS 的 一 种 类 型 ， 基 于 云 的 数据 库 方案 又 分 为 两 类 : 数据 即 服务 (Daas) 和 数据 
库 即 服务 (DBaaS)。 它 们 的 本 质 区 别 主要 是 如 何 管理 数据 : 
© DaaS, Daas 提供 在 云 中 定义 数据 和 按 需 检索 数据 的 能 力 。 不 像 传统 的 数据 库 方案 ， 


DaaS 不 实现 通常 如 SQL ( 见 第 6 章 ) 一 般 的 DBMS 接口 ， 而 是 通过 一 组 公共 API 

访问 数据 。Daasg 使 得 组 织 机 构 只 要 拥有 了 有 价值 的 数据 ， 就 能 创建 新 的 生财 之 道 。 

Daas 的 例子 有 Urban Mapping， 这 是 一 种 地 理 数 据 服 务 ， 它 为 消费 者 提供 数据 以 向 

入 他 们 自己 的 Web 网 站 或 应 用 中 。 还 有 提供 财经 数据 的 Xiguite， 以 及 提供 各 种 各 样 

组 织 机 构 的 业务 数据 的 Hoovers (Dun & Bradstreet 公司 )。 

DBaaS。DBaaS 为 应 用 开发 者 提供 完整 的 数据 库 机 制 。 在 DBaaS 中 ， 管 理 层 专门 负 

责 数据 库 的 持续 监视 和 配置 ， 使 其 达到 规模 优化 、 可 用 性 高 、 多 户 租 用 〈 即 可 为 多 

个 客户 机 构 服 务 )、 云 中 资源 的 有 效 分 配 ， 从 而 将 应 用 开发 者 从 管理 数据 库 的 任务 中 

解脱 出 来 。 作 为 一 种 服务 的 数据 库 架 构 ， 支 撑 下 列 必 要 的 能 力 : 

e 通过 按 需 目 服务 机 制 ， 使 数据 库 实例 的 提供 和 管理 能 因 消 费 者 不 同 而 不 同 。 

e 目 动 地 监视 和 服从 提供 者 制定 的 服务 定义 、 属 性 和 服务 层 质量 。 

e 数据 库 用 途 的 细 粒 度 测量 ， 以 获得 每 个 消费 者 的 展 后 报告 (show-back reporting) 
或 收回 功能 (charge-back functionality ) 。 


为 了 将 一 个 组 织 机 构 的 数据 与 男 一 个 组 织 机 构 的 数据 分 离开 来 ，DBaaS 可 呈现 若干 种 结 
构 。 我 们 考虑 下 面 几 种 : 


THES NRA AE 0 

共享 服务 器 ， 分 离 数 据 库 服务 进程 。 
FEE RG EIR at, OE o 
共享 数据 库 ， 分 离 模 式 。 

共享 数据 库 ， 共 享 模式 。 


分 离 服务 器 结构 
采用 分 离 服务 器 结构 时 ， 每 个 租户 占有 一 台 服 务 嚣 机， 该 台 机 器 仅 为 该 租户 的 数据 库 服 
务 。 这 种 结构 适用 于 要 求 高 度 隔离 、 上 自己 有 大 型 数据 库 、 其 上 有 大 量 的 用 户 且 用 户 有 特殊 性 
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能 要 求 的 组 织 机 构 。 这 种 方法 需要 较 高 的 费用 来 维护 设备 和 备份 租户 们 的 数据 。 图 3-15 说 
明了 这 种 结构 。 
共享 服务 器 ， 分 离 数据 库 服务 进程 结构 
采用 这 种 结构 时 ， 每 个 租户 有 自己 的 数 
据 库 ， 但 几 个 租户 共享 一 台 服 务 器 ， 每 个 租 
户 有 自己 的 服务 器 进程 。 这 种 结构 代表 着 通 
常 的 虚拟 机 环境 。 给 定 的 服务 器 资源 被 分 害 
给 每 一 租户 。 每 一 个 虚拟 环境 都 预定 了 自己 
的 主 存 和 磁盘 资源 ， 不 能 共享 别 的 虚拟 环境 
中 未 用 的 资源 。 用 这 种 方法 时 ， 主 存 和 辅 存 
可 能 是 个 问题 ， 因 为 每 个 租户 都 有 自己 的 数 
据 库 文件 和 服务 进程 。 此 外 ， 由 于 租户 们 共享 。 _ 
同一 台 机 器 ， 性 能 也 可 能 出 现 问题 ， 尽 管 云 提 a 
供 商会 给 每 台 机 器 少 分 配 租户 以 尽量 减少 风 本 ~ 
险 。 安 全 不 是 问题 ， 因 为 租户 已 完全 相互 隔 租户 A 的 用 户 租户 B 的 用 户 
离 。 图 3-16 说 明了 这 种 结构 。 图 3-15 多 租户 云 数 据 库 一 一 分 离 服 务 器 结构 


共享 数据 库 服 务 占 ， 分 离 数据 库 结构 
采用 这 种 结构 时 ， 每 个 租户 有 自己 分 离 的 数据 库 ， 但 与 其 他 租户 共享 同一 台数 据 库 服务 


需 《 和 同一 个 服务 进程 )。 较 之 前 一 种 方法 的 改进 之 处 是 ,单一 的 数据 库 服务 进程 能 使 租户 
们 共享 诸如 数据 库 缓存 之 类 的 资源 ， 使 计算 机 资源 得 到 有 效 利用 。 图 3-17 说 明了 这 种 结构 。 
= Ey 








MRA EE aahi 租户 B 的 用 户 apie k 租户 B 的 用 户 
图 3-16 ”共享 服务 器 ， 分 离 数据 库 服务 进程 结构 。 图 3-17 ”共享 数据 库 服务 器 ， 分 离 数 据 库 结构 


共享 数据 库 ， 分 离 模式 结构 

采用 这 种 结构 时 ， 只 有 一 个 共享 的 数据 库 服 务 器 ， 每 个 租户 的 数据 被 组 织 到 专 为 
其 创建 的 模式 中 。DBMS 必须 有 许可 机 制 以 保证 用 户 只 能 访问 其 被 许可 访问 的 数据 。 
图 3-18 说 明了 这 种 结构 。 
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租户 A 的 模式 
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租户 A 的 用 户 ” 租户 B 的 用 户 
图 3-18 “共享 数据 库 ， 分 离 模式 结构 


共享 数据 库 ， 共 享 模式 结构 

采用 这 种 结构 时 ， 只 有 一 个 共享 的 数据 库 服务 器 ， 所 有 租户 的 数据 被 组 织 到 同一 个 共享 
模式 中 。 此 时 ， 每 一 个 数据 库 表 中 都 有 一 列 用 于 指出 各 行 的 所 有 者 。 任 何 应 用 访问 数据 库 
表 的 行 时 ， 在 查询 中 必须 涉及 这 个 列 ， 以 保证 任 一 租户 不 会 看 见 他 人 的 数据 。 这 种 方法 的 
硬件 和 备份 开销 都 很 低 ， 因 为 就 一 台数 据 库 服务 器 来 说 ， 它 支持 的 租户 数目 最 大 。 然 而 ， 
由 于 多 个 租户 共享 同样 的 数据 库 表 ， 为 防止 租户 之 间 互 相 暴 露 数据 ， 可 能 需 在 安全 方面 多 
下 功夫 。 这 种 方法 适用 的 情形 是 ， 应 用 不 得 不 以 少量 的 服务 器 为 大 量 的 租户 服务 ， 同 时 预 
期 消费 者 愿意 牺牲 数据 隔离 性 以 换 得 低 成 本 。 图 3-19 说 明了 这 种 结构 。 








租户 A 和 B 共 用 单个 模式 


租户 A 的 用 户 租户 B 的 用 户 
图 3-19 ”共享 数据 库 ， 共 享 模式 结构 
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3.6 DBMS 的 组 件 


要 提供 2.4 节 给 出 的 所 有 功能 ，DBMS 必定 是 个 高 度 复 杂 的 软件 。 几 乎 不 可 能 给 出 
DBMS 的 通用 组 成 结构 ， 因 为 不 同 的 系统 之 间 存 在 很 大 的 差异 。 然 而 ， 通 过 查看 数据 库 系统 
的 各 组 件 和 它们 之 间 的 关系 来 理解 数据 库 系统 仍然 是 有 用 的 。 本 节 给 出 了 一 种 可 能 的 DBMS 
结构 。 下 节 将 讨论 Oracle DBMS 的 结构 。 

一 个 DBMS 可 以 被 分 成 者 干 软件 组 件 (或 者 模块 )， 每 个 组 件 都 被 分 配 了 特定 的 功能 。 如 
前 所 述 ，DBMS 的 一 些 功能 是 由 基本 的 操作 系统 支持 的 。 然 而 ， 操 作 系 统一 般 只 提供 基本 服 
务 ，DBMS 建立 在 其 上 。 因 此 ，DBMS 的 设计 必须 要 考虑 DBMS 与 操作 系统 之 间 的 接口 问题 。 

在 图 3-20 中 描述 了 DBMS 环境 中 主要 的 软件 组 件 。 这 个 图 显示 了 DBMS 如 何 解决 与 其 
他 软件 组 件 (如 用 户 查 询 和 访问 方法 ( 即 存储 和 检索 数据 记录 的 文件 管理 技术 )) 的 接口 问题 。 
在 附录 下 中 将 对 文件 组 织 和 访问 方法 进行 总 体 描述 。 感 兴趣 的 读者 大 想 更 加 全 面 地 了 解 ， 可 
以 参考 Teorey and Fry ( 1982 )、Weiderhold ( 1983 ), Smith and Barnes (1987) 和 Ullman ( 1988 )。 





数据 库 和 系统 目录 
3-20 DBMS 的 主要 组 件 


图 3-20 给 出 了 下 列 的 组 件 : 

e 查询 处 理 器 。 这 是 DBMS 的 一 个 主要 组 件 ， 它 将 所 有 的 查询 转换 成 一 系列 指导 数据 
库 管 理 器 运行 的 低层 指令 。 第 23 章 将 讨论 查询 处 理 过 程 。 

e 数据 库 管 理 器 (DM). DM 与 用 户 提交 的 应 用 程序 和 查询 处 理 需 接口 。DM 接受 查 
询 并 且 检 查 外 部 模式 和 概念 模式 ， 确 定 需要 哪些 概念 记录 才能 满足 查询 请 求 。 然 后 
DM 会 通知 文件 管理 器 来 执行 请 求 。 图 3-21 显示 了 DM 的 组 件 。 

o 文件 管理 器 。 文 件 管理 器 操纵 基本 存储 文件 ， 并 管理 磁盘 存储 空间 的 分 配 。 它 建立 
和 维护 内 部 模式 中 定义 的 结构 和 索引 的 列表 。 如 果 要 使 用 散 列 文件 ， 它 就 会 调用 散 
列 函 数 ， 产 生 记 录 地 址 。 文 件 管理 器 不 直接 管理 数据 的 物理 输入 和 输出 ， 而 是 将 请 
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求 传递 给 适当 的 操作 系统 访问 方法 ， 由 它 从 系统 缓冲 区 (或 高 速 缓 存 ) 中 读 出 或 写 人 
数据 。 

© DML 预 处 理 器 。 这 个 模块 将 家 入 应 用 程序 中 的 DML 语句 转换 成 宿主 语言 中 标准 的 
函数 调用 。DML 预 处 理 顺 必须 与 查询 处 理 器 相互 作用 并 产生 适当 的 代码 。 

© DDL 编译 器 。DDL 编译 器 将 DDL 语句 转换 成 一 组 包含 元 数据 的 表格 。 这 些 表格 将 
存储 在 系统 目录 中 ， 控 制 信息 将 存储 在 数据 文件 头 上 。 

e 目录 管理 器 。 目录 管理 器 控制 着 对 系统 目录 的 访问 ， 并且 维护 系统 目录 。 系 统 目 录 
可 以 被 大 多 数 的 DBMS 组 件 访问 。 






数据 库 和 系统 目录 
图 3-21 数据库 管 理 器 的 组 件 


数据 库 管理 器 的 主要 软件 组 件 如 下 : 

© 授权 控制 。 这 个 模块 检查 用 户 是 否 具有 必要 的 操作 权限 。 

© 命令 处 理 器 。 一旦 系统 检查 确认 用 户 具有 进行 操作 的 权限 ， 控 制 权 将 交 给 命令 管 

HAF o 

完整 性 检查 器 。 对 于 每 个 修改 数据 库 的 操作 ， 完 整 性 检查 器 检查 请 求 的 操作 是 否 满 

足 所 有 必要 的 完整 性 约束 《例如 关键 字 约 束 )。 

© 查询 优化 器 。 这 个 模块 确定 执行 查询 的 最 佳 策略 。 第 23 章 将 讨论 查询 优化 问题 。 

© 事务 管理 器 。 这 个 模块 执行 从 事务 接收 到 的 操作 序列 。 

© 调度 程序 。 这 个 模块 的 任务 是 确保 当前 在 数据 库 中 并 发 运行 的 操作 不 相互 冲突 。 它 
控制 着 事务 中 操作 执行 的 相对 顺序 。 


PIÈ REEKHAKS Web 65 


o 恢复 管理 器 。 这 个 模块 确保 当 发 生 失效 时 ， 数 据 库 能 够 保持 在 一 致 的 状态 。 它 还 负 
责 事务 提交 和 终止 。 
e 缓冲 区 管理 器 。 这 个 模块 负责 主 存 和 辅 存 之 间 的 数据 传输 ， 辅 存 包括 磁盘 和 磁带 等 。 
恢复 管理 占 和 缓冲 区 管理 顺 有 时 候 被 统称 为 数据 管理 器 。 缓 冲 区 管理 器 有 时 候 也 被 
PRAY E TRAE ES PERE o 
最 后 四 个 模块 将 在 第 22 章 讨 论 。 除 了 上 述 模块 外 ， 还 有 其 他 一 些 数据 结构 也 要 求 作为 
物理 级 实现 的 一 部 分 。 这 些 结构 包括 数据 和 索引 文件 及 系统 目录 。 有 关 部 门 已 经 在 DBMS 
标准 化 上 做 了 一 些 努 力 ， 并 且 数 据 库 体 系 结构 框架 任务 组 (Database Architecture Framework 
Task Group, DAFTG, 1986) 已 经 提出 了 一 个 参考 模型 。 这 个 参考 模型 的 目的 是 定义 一 个 
概念 框架 ， 旨 在 将 标准 化 的 工作 划分 成 许多 便于 管理 的 子 部 分 ， 并且 在 宏观 上 说 明 这 些 部 分 
是 如 何 相互 关联 的 。 


3.7 Oracle 的 体系 结构 


Oracle 基于 3.1.3 节 中 讨论 过 的 客户 -服务 器 结构 。Oracle 服务 器 由 数据 库 (原始 数据 
加 上 日 志和 控制 文件 ) 和 实例 (服务 器 上 负责 存 取 数据 库 的 进程 和 系统 内 存 ) 组 成 。 一 个 实 
例 仅 能 与 一 个 数据 库 相 连 。 数 据 库 由 逻辑 结构 和 物理 结构 组 成 ,逻辑 结 构 如 数据 库 模式 ， 物 
理 结构 包括 形成 Oracle 数据 库 的 文件 。 现 在 来 详细 讨论 数据 库 的 逻辑 结构 和 物理 结构 以 及 
系统 进程 。 


3.7.1 . Oracle 的 逻辑 数据 库 结 构 

在 逻辑 层 ，Oracle 包含 表 空 间 、 模 式 、 数 据 块 以 及 区 间 /上段 。 
表 空间 

一 个 Oracle 数据 库 被 划分 成 若干 个 逻辑 存储 单元 ， 称 为 表 空 间 (tablespace), UHAR 
空间 将 相关 的 逻辑 结构 组 织 在 一 起 。 例 如 ， 表 空间 一 般 会 把 一 个 应 用 程序 的 所 有 对 象 组 织 在 
一 起 ， 以 简化 某 些 管理 操作 。 

每 个 Oracle 数据 库 都 包含 一 个 名 为 SYSTEM 的 表 空 间 ， 它 是 在 创建 数据 库 时 自动 生成 
的 。SYSTEM 表 空 间 通 常 包 含 整个 数据 库 的 系统 目录 表 (在 Oracle 中 ， 称 为 数据 字典 )。 一 
个 小 型 数据 库 可 能 只 需要 一 个 SYSTEM 表 空 间 ， 但 最 好 再 创建 一 个 表 空 间 ， 用 以 与 数据 字 
典 分 开 存放 用 户 数据 ， 从 而 减少 字典 对 象 和 模式 对 象 因 同 名 数据 文件 带 来 的 冲突 。 图 3-22 
给 出 了 一 个 由 SYSTEM 表 空 间 和 USER DATA 表 空 间 所 组 成 的 Oracle 数据 库 。 

可 以 用 CREATE TABLESPACE 命令 来 创建 一 个 新 的 表 空 间 ， 例 如 : 

CREATE TABLESPACE user data 

DATAFILE ‘DATA3.ORA’ SIZE 100K 


EXTENT MANAGEMENT LOCAL 
SEGMENT SPACE MANAGEMENT AUTO; 


然后 ， 可 以 通过 CREATE TABLE Æ ALTER TABLE 语句 ， 将 表 与 指定 的 表 空 间 相 
连 ， 例 如 : 


CREATE TABLE PropertyForRent (propertyNo VARCHAR2(5) NOT NULL, ... ) 
TABLESPACE user_data; 
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图 3-22 Oracle 数据库 、 表 空间 和 数据 文件 之 间 的 关系 
如 果 在 创建 新 表 时 没有 指定 表 空 间 ， 则 会 用 到 创建 用 户 账户 时 与 用 户 相 连 的 默认 表 


空间 。 
用 户 、 模 式 和 模式 对 象 

AA (有 时 称 为 用 户 名 ) 是 数据 库 中 定义 的 一 个 名 称 ， 它 可 以 连接 或 访问 对 象 。 模 式 是 
模式 对 象 的 一 个 命名 集合 ， 如 表 、 视 图 、 索 引 、 簇 集 和 过 程 ， 它 与 特定 的 用 户 相 连 。 模 式 和 
用 户 的 概念 有 助 于 DBA 管理 数据 库 的 安全 。 

为 了 对 数据 库 进行 存 取 ， 用 户 必 须 首 先 运行 一 个 数据 库 应 用 程序 (如 Oracle Forms 或 
SQL*Plus)， 然 后 用 数据 库 中 已 定义 的 一 个 用 户 名 来 连接 。 在 创建 一 个 数据 库 用 户 时 ， 将 会 
相应 地 为 该 用 户 创 建 一 个 同名 的 模式 。 在 默认 状态 下 ， 一旦 用 户 与 数据 库 相 连 ， 用 户 就 可 以 
对 其 模式 中 的 所 有 对 象 进行 存 取 。 因 为 用 户 只 与 同名 模式 相连 ， 所 以 “用 户 ” 和 “模式 ”这 
两 个 词 可 以 互 换 (注意 ， 表 空间 与 模式 之 间 不 存在 任何 关系 : 在 同一 模式 中 的 对 象 可 以 放 在 
不 同 的 表 空 间 中 ， 一 个 表 空 间 也 可 以 保存 不 同 模式 中 的 对 象 )。 
数据 块 、 区 间 和 段 

数据 块 是 Oracle 可 使 用 ， 或 者 说 可 分 配 的 最 小 存储 单元 。 一 个 数据 块 与 物理 磁盘 空间 
中 一 定数 量 的 字 节 相对 应 。 可 以 在 创建 Oracle 数据 库 时 设置 数据 块 的 大 小 。 数 据 块 大 小 可 
以 是 操作 系统 中 块 大 小 的 倍数 〈 须 在 系统 的 最 大 操作 范围 内 )， 这 样 可 以 避免 不 必要 的 IO 操 
作 。 数 据 块 的 结构 如 下 : 

e 标题 : 包含 块 地 址 和 上 段 类 型 等 一 般 信息 。 

e 表 目 录 : 包含 将 数据 放 在 此 块 的 表 的 相关 信息 。 

e 行 目录 : 包含 该 数据 块 中 的 行 的 相关 信息 。 

© TRE: 包含 实际 的 表 数 据 行 。 行 可 以 跨 块 存放 。 

e ZAZ: 分 配给 新 插入 的 行 或 更 新 行 时 需要 的 额外 空间 。 自 Oracle8i 以 来 ，Oracle 

能 上 自动 管理 空闲 空间 ， 尽 管 还 有 一 个 手动 管理 选项 。 
在 本 书 Web 网 站 的 附录 J 中 说 明了 如 何 用 这 些 成 分 来 估计 Oracle RANK. RB 
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库 空 间 的 第 二 个 层次 称 为 区 间 (extent)。 区 间 是 一 定数 量 的 连续 数据 块 ， 用 来 存储 某 种 特 
定 类 型 的 信息 。 区 间 之 上 的 层次 就 是 段 。 段 是 区 间 的 集合 ， 用 来 存储 茶 个 逻辑 结构 。 例 如 ， 
每 个 表 的 数据 都 存在 它 自己 的 数据 段 中 ， 而 每 个 索引 的 数据 则 存在 它 自 己 的 索引 段 中 。 图 
3-23 展示 了 数据 块 、 区 间 和 段 之 间 的 关系 。 当 某 个 段 的 现 有 的 区 间 已 满 时 ， 就 由 Oracle 动 
态 地 分 配 新 空间 。 因 为 区 间 是 根据 需要 分 配 的 ， 所 以 包含 在 段 中 的 区 间 在 磁盘 上 可 能 连续 也 
可 能 不 连续 。 





区 间 构 成 的 32K 段 
图 3-23 Oracle 数据 块 、 区 间 和 有 段 之 间 的 关系 


3.7.2 Oracle 的 物理 数据 库 结 构 


Oracle 中 主要 的 物理 数据 库 结 构 是 数据 文件 、 重 做 日 志文 件 和 控制 文件 。 
数据 文件 

每 个 Oracle 数据 库 都 有 一 个 或 多 个 物理 数据 文件 。 人 逻辑 数据 库 结构 (如 表 和 索引 ) 中 的 
数据 是 以 数据 文件 这 样 的 物理 形式 存储 的 。 如 图 3-22 所 示 ， 一 或 多 个 数据 文件 形成 一 个 表 
空间 。 最 简单 的 Oracle 数据 库 可 能 只 有 一 个 表 空 间 和 一 个 数据 文件 。 更 复杂 的 数据 库 可 能 
会 包含 四 个 表 空 间 ， 每 个 表 空 间 中 有 两 个 数据 文件 ， 因 此 总 共有 八 个 数据 文件 。 
重 做 日 志文 件 

每 个 Oracle 数据 库 都 有 一 个 由 两 个 (或 更 多 ) 重 做 日 志文 件 所 构成 的 集合 ， 它 记录 了 对 
数据 进行 的 所 有 更 改 ， 甚 目的 是 便于 以 后 的 恢复 。 某 个 故障 可 能 使 得 修改 了 的 数据 未 能 永久 
地 写 入 数据 文件 ， 那 么 可 从 重 做 日 志 中 获取 这 个 修改 ， 从 而 防止 丢失 工作 。 我 们 将 在 22.3 
节 中 详细 讨论 恢复 机 制 。 
控制 文件 

每 个 Oracle 数据 库 都 有 一 个 控制 文件 ， 它 包含 了 所 有 其 他 文件 (这些 文 件 都 参与 了 数据 
库 的 组 成 ) 的 一 个 列表 ， 例如， 数据 文件 和 重 做 日 志文 件 。 为 了 更 好 地 对 数据 进行 保护 ， 最 
好 有 多 个 控制 文件 (可 以 将 多 个 副本 写 人 多 个 设备 中 )。 同 样 ， 最 好 也 保存 多 个 重 做 日 志文 
件 的 副本 。 
Oracle 实例 

Oracle 实例 由 Oracle 进程 和 对 数据 库 中 的 信息 进行 存 取 所 需 的 共享 内 存 组 成 。 实 例 由 
Oracle 的 后 台 进 程 、 用 户 进 程 ， 以 及 由 这 些 进 程 所 使 用 的 共享 内 存 组 成 ， 如 图 3-24 所 示 。 
其 中 ，Oracle 使 用 共享 内 存 对 数据 和 索引 进行 高 速 缓 存 ， 并 对 共享 程序 代码 进行 存储 。 共 享 
内 存 可 以 划分 为 不 同 的 内 存 结构 ， 其 中 最 基本 的 是 系统 全 局 区 ( System Global Area, SGA) 
和 程序 全 局 区 (Program Global Area, PGA). 
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系统 全 局 区 。SGA 是 共享 内 存 的 一 片区 域 ， 用 来 存储 某 个 Oracle 实例 的 数据 和 控制 

信息 。 在 Oracle 实例 开始 时 分 配 SGA ， 关 闭 时 回收 SGA. SGA 中 的 信息 由 下 列 内 

存 结构 组 成 ， 其 中 的 每 个 结构 都 有 固定 的 大 小 ， 并 且 都 在 实例 启动 时 创建 : 

图 数据 库 高 速 缓冲 区 。 它 包含 了 数据 库 最 近 使 用 过 的 数据 块 。 这 些 数据 块 可 以 是 已 
修改 但 还 没 写 入 磁盘 的 数据 ( 脏 块 )， 也 可 以 是 没 被 修改 的 数据 ， 还 可 以 是 修改 后 已 
写 入 磁盘 的 数据 (干净 块 )。 存 储 最 近 使 用 过 的 数据 块 可 使 大 多 数 活 路 的 数据 缓冲 
在 内 存 ， 从 而 减少 1/0O， 提 高 系统 的 性 能 。22.3.2 节 中 将 讨论 缓冲 区 管理 策略 。 

e 重 做 日 志 缓 冲 区 。 它 包含 了 重 做 日 志文 件 中 的 项 ， 可 用 于 以 后 的 恢复 (参见 22.3 
节 )。 后 台 进 程 LGWR 负责 把 重 做 日 志 缓 冲 区 的 内 容 写 到 磁盘 上 活跃 的 联机 重 做 
日 志文 件 中 。 

E 共享 池 。 它 包含 了 一 些 共 享 的 内 存 结构 ， 如 库 高 速 缓存 (library cache) 中 的 共享 
SQL 区 和 数据 字典 中 的 内 部 信息 。 共 享 SQL 区 中 包含 SQL 查询 的 分 析 树 和 执行 
规划 。 如 果 多 个 应 用 程序 都 用 到 了 同一 个 SQL 语句 ， 那 它们 都 能 对 共享 SQL 区 
进行 存 取 ， 从 而 减少 了 所 需 的 内 存 数量 ， 也 减少 了 查询 处 理 所 需 的 分 析 和 执行 时 
间 。 第 23 章 将 讨论 查询 处 理 。 

四 大 池 。 这 是 一 片 可 选 的 内 存 区 ， 用 于 大 片 内 存 分 配 (例如 ， 缓 冲 恢复 管理 器 
(RMAN) 的 大 量 IO 内 容 )。 

m Java 池 。 这 片区 域 存储 所 有 会 话 专 有 ] Java 代码 和 Java 虚拟 机 内 的 数据 。 

E 流 池 。 这 片区 域 用 于 存储 缓冲 的 队列 消息 并 为 Oracle 流 提 供 内 存 。Oracle 流 使 信 
息 流 (如 数据 库 事件 和 数据 库 变化 ) 能 被 管理 并 潜在 地 传播 到 其 他 数据 库 。 

= 固定 SGA。 这 是 一 个 内 部 管理 区 ， 它 包含 各 种 各 样 的 数据 ， 如 关于 数据 库 状 态 和 
Oracle 实例 的 信息 ， 以 及 Oracle 进程 间 通 信 的 信息 ， 比 如 锁 信 息 等 。 

程序 全 局 区 。PGA 是 共享 内 存 的 一 片区 域 ， 用 来 存储 一 个 Oracle 进程 的 数据 和 控制 

信息 。PGA 由 Oracle Database 在 一 个 Oracle 进程 开启 时 创建 。 每 个 服务 器 进程 和 后 

台 进 程 都 有 一 个 PGA。 其 大 小 和 内 容 由 Oracle 服务 器 的 安装 选项 决定 。 

客户 进程 。 每 个 客户 进程 都 代表 一 个 客户 与 Oracle 服务 器 的 一 个 连接 例如， 使 用 

SQL*Plus 或 是 Oracle Forms 应 用 程序 )。 客 户 进程 操纵 着 用 户 输入 、 与 Oracle 服务 

器 进程 的 通信 及 显示 客户 所 需 的 信息 ， 如 果 需 要 ， 还 可 以 将 这 些 信息 转换 为 更 有 效 

的 形式 。 

Oracle 进程 。Oracle (IRAE) 进程 根据 客户 需求 执行 相应 功能 。.Oracle 进程 可 以 分 

成 两 类 : 服务 器 进程 (处理 相 连 的 用 户 进 程 所 发 出 的 请 求 ) 和 后 人 台 进 程 (执行 异步 1/ 

O， 并 提供 了 更 大 的 并 行 性 ， 从 而 提高 了 系统 的 性 能 和 可 靠 性 )。 在 图 3-24 中 给 出 了 

如 下 的 后 台 进 程 ， 

es 数据 库 写 回 器 (DBWR)。DBWR 进程 负责 将 已 修改 的 ( 脏 的 ) 数据 块 从 SGA 高 
速 缓存 区 写 回 到 磁盘 的 数据 文件 中 。 一 个 Oracle 实例 至 多 有 10 个 DBWR 进程 ， 
从 DBW0 ~ DBW9 依次 命名 ， 用 来 处 理 多 个 数据 文件 的 IO。Oracle 采用 了 一 
种 称 为 先 写 日 志 的 技术 (参见 22.3.4 节 )， 这 就 意味 着 ， 每 当 需 要 释放 缓冲 区 时 ， 
DBWR 进程 就 会 批量 地 执行 写 出 ， 而 不 用 等 到 事务 的 提交 点 。 

e 日 志 写 回 器 (LGWR)。LGWR 进程 负责 将 数据 从 日 志 绥 冲 区 写 回 到 重 做 日 志文 
件 中 。 
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检查 点 〈(CKPT)。 检 查 点 是 一 个 事件 ， 在 这 个 事件 中 ， 所 有 已 修改 的 数据 库 组 

冲 区 都 会 由 DBWR 写 回 到 数据 文件 中 (参见 22.3.2 节 )。CKPT 进程 负责 通知 

DBWR 进程 执行 检查 点 ， 并 更 新 数据 库 中 的 所 有 数据 文件 和 控制 文件 ， 使 它们 与 

最 近 的 检查 点 一 致 。CKPT 进程 是 可 选 的 ， 如 果 将 其 省 略 ， 则 由 LGWR 进程 来 完 

成 它 的 工作 。 

系统 监视 器 (SMON)。 当 实例 从 一 个 出 错 点 重新 开始 时 ， 由 SMON 进程 负责 对 

系统 事故 进行 恢复 。 因 系统 前 溃 而 终止 的 事务 的 恢复 也 包括 在 内 。SMON 还 充当 

了 数据 库 的 磁盘 碎片 整理 程序 ， 它 可 以 将 数据 文件 中 的 空闲 区 间 进 行 整合 。 

进程 监视 器 (PMON). PMON 进程 负责 跟踪 对 数据 库 进 行 存 取 的 用 户 进程 ， 并 在 

系统 崩溃 后 对 其 进行 恢复 。 它 将 清除 所 有 的 遗留 资源 (如 内 存 )， 并 释放 由 故障 进 

程 所 加 的 锁 。 

m 归档 器 (ARCH)。 当 在 线 的 重 做 日 志文 件 被 写 满 时 ， 由 ARCH 进程 负责 将 它们 复 
制 到 归档 器 上 。 系 统 最 多 可 设 定 10 个 ARCH 进程 ， 依 次 命名 为 ARCO ~ ARCS. 
其 余 的 归档 器 进程 可 以 在 有 读 写 指令 时 由 LWGR 局 动 。 

m 恢复 器 (RECO), RECO 进程 负责 清除 出 错 的 或 是 挂 起 的 分 布 事务 (参见 25.4 市 )。 

锁 管 理 服 务 器 ( LMS)。 如 果 采 用 了 Oracle Real Application Cluster 选项 ， 则 由 

LMS 进程 负责 实例 间 的 加 锁 操 作 。 

闪 回 写 和 恢复 写 (FWRW)。 当 设置 内 回 或 遇 到 保证 还 原点 ，FWRW 进程 将 闪 回 

数据 写 入 闪 回 恢复 区 的 闪 回 数据 库 日 志 。 闪 回 工 具 使 管理 员 和 用 户 能 回 看 和 操纵 

一 个 Oracle 实例 以 前 的 状态 ， 而 无 需 将 数据 库 恢复 到 以 前 的 时 间 点 。 

易 处 理性 监控 (MMON)。 这 个 进程 执行 许多 与 Automatic Workload Repository 

(AWR) 相关 的 任务 。AWR 负责 存储 一 些 历史 性 能 数据 ,包括 关于 系统 、 会 话 、 

单个 SQL 语句 、 段 和 服务 的 累加 的 统计 数据 。MMON 进程 负责 包括 每 小 时 收集 

一 次 统计 信息 并 产生 一 个 AWR 快照 在 内 的 许多 工作 。 

易 处 理性 监控 Lite (MMNL)。 这 个 进程 负责 将 SGA 中 Active Session History (ASH) 

缓冲 区 里 的 统计 数据 写 人 磁盘 。 当 ASH 满 时 MMNL 写 人 磁盘 。 

在 前 面 的 描述 中 大 多 使 用 了 “进程 ”这 个 词 ， 目 前 一 些 系统 会 在 实现 中 用 线程 来 取代 
进程 。 

进程 之 间 相 互 作用 的 实例 

下 面 的 例子 给 出 了 一 个 Oracle 配置 ， 在 一 台 机 顺 上 和 运行 服务 需 进 程 ， 而 在 另 一 台 机 天 

上 有 一 个 连接 到 服务 器 上 的 用 户 进程 。Oracle 使 用 称 为 Oracle Net Services 的 通信 机 制 来 实 

现 不 同 机 器 上 的 进程 之 间 的 通信 。Oracle Net Services 支持 各 种 各 样 的 网 络 协议 ， 例 如 TCP/ 

IP。 该 服务 还 可 以 实现 各 网 络 协议 之 间 的 转换 ， 因 此 ， 人 允许 使 用 一 种 协议 的 客户 端 与 使 用 另 

一 种 协议 的 数据 库 服 务 需 交互 。 

(1 ) 客户 端 以 用 户 进程 运行 一 个 应 用 程序 。 客 户 应 用 程序 通过 Oracle Net Services KIK 

动 程序 建立 与 服务 器 的 连接 。 

(2 ) 服务 器 检测 应 用 程序 所 发 出 的 连接 请 求 ， 并 创建 一 个 〈 专 用 的 ) 服务 需 进 程 代 表 用 

户 进程 。 

(3) 用 户 执行 一 条 SQL 语句 ， 修 改 表 中 的 某 行 数据 并 提交 事务 。 


实例 
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图 3-24 Oracle 的 体系 结构 (HRA Oracle 文档 集 ) 


(4) 服务 器 进程 接收 这 条 语句 ， 并 检查 共享 池 看 共享 SQL IX PHA HG IX A SQL 语 
句 。 如 果 找 到 了 这 样 一 个 共享 SQL 区 ， 服 务 器 将 检查 用 户 对 请 求 数 据 的 访问 权限 ， 帮 通过 
则 用 前 面 找 到 的 共享 SQL 区 处 理 这 一 语句 。 如 果 没 有 找到 ， 则 分 配 一 个 新 的 SQL 区 来 对 这 
条 语句 进行 分 析 和 处 理 。 

(5) 服务 器 进程 将 从 数据 文件 ( 表 ) 或 是 SGA 中 获取 所 需 的 数据 。 

(6) 服务 器 进程 修改 SGA 中 的 数据 。DBWR 进程 在 合适 时 ， 会 将 已 修改 的 数据 块 永久 
地 写 回 到 磁盘 上 。 事 务 提 交 后 ，LGWR 进程 立刻 将 事务 记录 到 在 线 的 重 做 日 志文 件 中 。 

(7) 服务 器 进程 通过 网 络 将 成 功 / 失 败 消息 发 送 到 应 用 程序 。 

(8) 在 这 段 时 期 内 ， 其 他 的 后 台 进 程 均 在 运行 ， 时 刻 注意 可 能 需要 干涉 的 任何 情况 。 田 
外 , Oracle 服务 器 还 管理 着 其 他 用 户 事 务 ， 并 防止 众 事务 因 对 同一 数据 进行 操作 引发 的 冲突 。 
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本 章 小 结 


客户 - 服务 器 结构 指 的 是 软件 组 件 相互 作用 的 一 种 方法 。 有 请 求 资源 的 客户 进程 和 提供 资源 的 服务 
器 。 在 两 层 模型 中 ， 客 户 进程 负责 用 户 界面 和 业务 处 理 逻辑 ， 服 务 器 负责 数据 库 功能 。 在 Web I 
境 下 ， 传 统 的 两 层 模型 被 三 层 模型 替代 ， 此 时 有 分 布 在 不 同 机 器 上 的 用 户 界面 层 (客户 )、 业 务 逻辑 
和 数据 处 理 层 (应 用 服务 器 ) 和 DBMS (数据 库 服务 器 )。 

三 层 结构 可 扩展 为 n 层 结 构 ， 加 入 另外 层 的 目的 是 提高 灵活 性 和 可 伸缩 性 。 


。 中 间 件 是 连接 软件 组 件 或 连接 应 用 的 计算 机 软件 。 中 间 件 的 类 型 有 (同步 与 异步 ) RPC 、 发 布 / 订 


阅 、 面 问 消 息 中 间 件 (MOM)、 对 象 请 求 代理 (ORB) 和 数据 库 中 间 件 。 

Web 服务 是 一 种 软件 系统 ， 用 于 支持 跨 网 络 且 可 互 操作 的 机 带 与 机 器 之 间 的 交互 。 它 们 基于 
XML, SOAP, WSDL 和 UDDI 等 标准 。 

SOA 是 一 种 以 业务 为 中 心 构造 应 用 的 软件 结构 ， 它 用 已 发 布 的 一 组 服务 来 实现 业务 过 程 ， 服 务 的 
粒度 与 消费 者 相关 。 

云 计 算是 一 种 对 可 配置 计算 资源 池 (例如, 网络、 服务器、 存储 、 应 用 和 服务 等 ) 进行 随处 、 便 捷 、 
按 需 网 络 访问 的 模式 (model)， 并 且 这 些 计 算 资 源 的 获取 和 释放 都 只 需 很 少 的 管理 成 本 或 者 只 需 与 
服务 提供 商 很 少 的 交互 。 三 种 主要 的 服务 模式 是 软件 即 服务 (Software as a Service, SaaS )、 平 台 即 
服务 ( Platform as a Service, PaaS)、 基 础 设施 即 服 务 ( Infrastracture as a Service, JaaS ) 。 基 于 云 的 数 
据 库 方案 分 为 两 类 : 数据 即 服务 (DaaS) 和 数据 库 即 服务 (DBaaS ) 。 

事务 处 理 (TP) 监视 器 是 一 个 控制 客户 和 服务 器 之 间 数 据 传输 的 程序 ， 这 些 控制 是 为 了 提供 一 个 一 
致 的 环境 ， 尤 其 是 为 联机 事务 处 理 (4OLTP) 提供 一 致 的 环境 。 它 的 好 处 包括 事务 路 由 、 分 布 式 事 
务 、 负 载 平 衡 、 漏 斗 效 应 以 及 增强 可 靠 性 。 


思考 题 


3.1 


3.2 


3.3 
3.4 
3.) 
3.6 
3.7 
3.8 
3.9 
31 
3.1 
3.1 
3.1 
3.1 
3.1 


客户 - MRE RAWRABHA? 这 种 结构 有 何 优点 ? 试 将 客户 - 服务 器 结构 与 其 他 两 种 结构 进行 
比较 。 
针对 传统 的 DBMS， 对 比 两 层 客户 - 服务 器 结构 与 三 层 客户 - 服务 器 结构 。 为 什么 后 者 更 适 于 
Web ? 
什么 是 nn 层 结构 ? 
什么 是 中 间 件 ? 给 出 一 种 中 间 件 分 类 。 
什么 是 TP 监视 器 ? TP 监视 器 给 OLTP 环境 带 来 了 什么 好 处 ? 
什么 是 Web 服务 ? 
开发 Web 服务 用 到 哪些 技术 与 标准 ? 它们 之 间 如 何 关联 ? 
什么 是 面向 服务 的 结构 ? 
给 出 一 个 面向 服务 结构 的 例子 。 
0 什么 是 云 计算 ? 
1 讨论 云 计算 的 五 个 基本 特征 。 
2 讨论 云 计 算 的 三 种 主要 服务 模式 。 
3 对 比 云 的 四 类 部 署 模式 。 
4 数据 即 服务 (DaaS) 与 数据 库 即 服务 (DBaaS) 有 何 差别 ? 
5 讨论 数据 库 作 为 服务 的 不 同 结构 模型 。 





3.16 描述 DBMS 的 主要 成 分 。 
3.17 描述 Oracle 的 内 部 结构 。 


习题 


3.18 ”查阅 Microsoft SQL Server, Oracle 和 IBM 的 DB2 的 文档 ,说 明 它们 对 下 述 内 容 的 支持 : 


(a) 客户 - 服务 器 结构 
(b) Web 服务 
(c) 面 回 服务 结构 


3.19 在 网 上 搜索 3.2 节 所 述 以 外 的 若干 Web 服务 。 它 们 有 什么 共同 之 处 ? 说明 它们 是 否 访 问 数据 库 。 
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关系 模型 





| 本 章 目标 


本 章 我 们 主要 学 习 : 

关系 模型 的 起 源 

关系 模型 的 术语 

如 何 用 表 来 表示 数据 

数学 中 的 关系 与 关系 模型 中 的 关系 之 关联 
数据 库 中 关系 的 性 质 

如 何 区 分 候选 关键 字 、 主 关键 字 、 可 替换 关键 字 与 外 部 关键 字 
实体 完整 性 与 引用 完整 性 的 含义 

关系 系统 中 视图 的 用 途 与 优点 


在 目前 使 用 的 数据 处 理 软件 中 ， 关 系数 据 库 管理 系统 (Relational Database Management 
System, RDBMS) 占据 了 统治 地 位 ， 估 计 2011 年 全 世界 销售 额 在 240 亿美 元 ，2016 年 将 
上 升 到 370 亿美 元 。 这 个 软件 代表 了 第 二 代数 据 库 管理 系统 ( DBMS),， 它 是 基于 E. F. Codd 
(1970) 所 提出 的 关系 数据 模型 。 在 关系 模型 中 ， 所 有 数据 逻辑 上 被 组 织 成 关系 〈 表 ) 结构 。 
每 个 关系 都 有 自己 的 名 称 ， 并 由 数据 的 一 些 命名 属性 ( 表 中 的 列 ) 所 组 成 。 每 个 元 组 ( 表 中 
的 行 ) 包含 每 个 属性 的 一 个 取 值 。 关 系 模型 的 最 大 优点 就 在 于 其 逻辑 结构 人 简单。 但 这 种 简单 
的 结构 却 有 着 可 靠 的 理论 基础 ， 这 正 是 第 一 代 DBMS (网 状 与 层次 DBMS) 所 缺乏 的 。 

由 于 RDBMS 的 重要 性 ， 本 书 将 对 这 类 系统 进行 重点 介绍 。 本 章 主 要 介绍 关系 数据 模型 
的 常用 术语 和 基本 概念 。 在 下 一 章 中 ,将 对 用 于 数据 更 新 和 数据 检索 的 关系 语言 进行 讨论 。 


为 了 对 RDBMS 有 一 个 全 面 的 了 解 ， 在 4.1 节 中 提供 了 关系 模型 的 简 史 。4.2 节 介 绍 关 
系 模型 的 基本 概念 和 术语 。4.3 节 将 对 关系 的 完整 性 约束 进行 讨论 ， 其 中 包括 实体 完整 性 和 
引用 完整 性 。4.4 节 介 绍 视图 的 概念 ， 虽 然 这 是 RDBMS 的 重要 特征 ， 但 严格 地 说 ， 它 并 不 
属于 关系 模型 的 国有 概念 。 

第 5 一 9 章 将 分 析 结 构 化 查询 语言 SQL (Structured Query Language)， 它 是 RDBMS 形 | 
式 上 和 事实 上 的 标准 语言 。 在 附录 M 中 还 将 分 析 QBE (举例 查询 )， 它 是 RDBMS 为 外 一 种 
相当 流行 的 可 视 化 查询 语言 。 第 16 一 19 章 提 供 了 进行 关系 数据 库 设 计 的 一 套 完 整 的 方法 
学 。 附 录 G 分 析 Codd 的 12 条 规则 ， 它 是 鉴别 RDBMS 产品 的 标准 。 本 章 中 所 用 到 的 例子 
取 自 DreamHome 案例 ， 在 11.4 节 与 附录 A 中 有 详细 描述 。 


4.1 关系 模型 简 史 
关系 模型 由 E. F. Codd 在 他 的 具有 开创 意义 的 论文 “大 型 共享 资料 库 的 关系 数据 模型 ” 
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(A Relational Model of Data for Large Shared Data Banks, 1970) 中 首次 提出 。 昌 然 Childs 
曾 先 于 他 在 1968 年 提出 过 面向 络 的 模型 ， 但 目前 普遍 认为 Codd 的 这 篇 论文 是 数据 库 系统 
发 展 的 里 程 碑 。 关 系 模 型 的 目标 为 : 
e 实现 高 度 的 数据 独立 性 。 更 改 内 部 数据 的 表示 方式 ， 特 别 是 对 文件 组 织 方式 、 记 录 
顺序 以 及 访问 路 径 进行 更 改 时 ， 应 用 程序 将 不 再 受 影 啊 。 
o 提供 坚实 的 理论 基础 ， 用 以 处 理 数 据 语义 、 数 据 一 致 性 以 及 数据 元 余 等 问题 。 在 
Codd 的 论文 中 还 特别 地 提出 了 规范 化 关系 的 概念 ， 即 不 含 重复 组 的 关系 (在 第 14、 
15 章 将 对 规范 化 过 程 进行 讨论 )。 
e 扩展 面 问 络 的 数据 操作 语言 。 
虽然 很 多 研究 组 的 工作 都 涉及 关系 模型 ， 但 最 主要 的 研究 可 能 还 要 归属 于 三 个 有 着 完全 
不 同 前 景 的 项 目 。 第 一 个 是 20 世纪 70 ERR, IBM 在 加 利 福 尼 亚 州 成 立 的 San Jose 人 研究 
所 开发 的 实验 性 RDBMS System R (Astrahan et al., 1976 年 )。 这 个 项 目 是 为 了 证 明 关 系 模 
型 的 实用 性 而 设计 的 ， 为 此 它 提 供 了 关系 模型 中 数据 结构 与 操作 的 一 整套 实现 方案 。 此 外 ， 
对 于 实现 RDBMS 的 大 和 干 机 制 ， 例 如 事务 管理 、 并 发 控制 、 恢 复 技 术 、 查 询 优化 、 数 据 安全 
与 完整 性 、 人 的 因素 及 用 户 界 面 等 ， 它 也 提供 了 一 个 极 好 的 信息 源 。 人 们 围绕 该 系统 发 表 了 
许多 研究 论文 ， 开 发 了 许多 其 他 原型 。System R 项 目 主 要 推动 了 下 面 两 类 重大 的 成 果 : 
e 结构 化 查询 语言 一 一 SQL 的 发 展 ， 它 从 此 成 为 了 国际 标准 化 组 织 (ISO) 颁布 的 和 实 
际 应 用 中 的 RDBMS 标准 语言 。 
e 从 20 世纪 70 年 代 后 期 到 20 世纪 80 年 代 涌 现 了 各 种 各 样 的 商业 化 RDBMS 产品 ， 
例如 IBM 的 DB2 和 SQL/DS， 以 及 Oracle 公司 的 Oracle. 
关系 模型 发 展 史 上 第 二 个 重要 项 目 是 ， 加 州 大 学 伯克利 分 校 开 发 的 交互 式 制 图 检索 系统 
INGRES ( Interactive Graphics Retrieval System) 项 目 ， 它 与 System R 项 目 几 乎 同时 进行 。 
该 项 目 重点 开发 一 个 原型 RDBMS ， 研 究 目标 与 System R Wih — fks INGRES 的 学 院 版 就 此 
诞生 ， 它 对 普及 关系 的 概念 做 出 了 贡献 ， 同 时 也 衍生 出 一 些 商 业 化 产品 。 例 如 ，Relational 
Technology 公司 (现在 是 Actian 公司 ) 推出 的 INGRES， 以 及 Britton Lee 公司 推出 的 智能 数 
据 库 机 (Intelligent Database Machine) o 
第 三 个 项 目 是 位 于 Peterlee 的 IBM UK Scientific Centre 所 开发 的 关系 测试 工具 Peterlee 
(Todd，1976 )。 这 个 项 目 比 System R FI INGRES 项 目 更 偏 理 论 研究 ， 而 且 也 更 有 意义 ， 特 
别 是 它 对 查询 处 理 和 优化 及 功能 扩展 等 问题 的 研究 。 
20 世纪 70 FARRE 20 世纪 80 年 代 初 ， 开 始 出 现 基于 关系 模型 的 商业 系统 。 涌 现 了 几 百 
个 RDBMS， 其 中 有 为 大 型 机 设计 的 ， 也 有 在 PC 环境 下 运行 的 ， 虽 然 它们 中 的 许多 都 不 遵守 严 
格 意义 上 的 关系 模型 。 例 如 ， 基 于 PCH RDBMS 有 Microsoft 推出 的 Access 和 Visual FoxPro, 
Embarcadero Technologies 推出 的 InterBase， 以 及 R:BASE Technologies 推出 的 R:Base. 
因为 关系 模型 的 普遍 性 ， 许 多 非 关系 系统 现在 也 提供 了 关系 型 的 用 户 界面 ， 而 不 管 这 
个 界面 下 的 真正 模型 是 什么 。IDMS 原来 是 网 状 数据 库 管 理 系统 ， 已 变 成 CA 公司 〈 以 前 叫 
Computer Associates) 的 CA-IDMS， 它 支持 数据 的 关系 型 视图 。 另 外 ， 支 持 某 些 关 系 特征 的 
大 型 机 DBMS 还 有 美国 计算 机 协会 推出 的 Model 204 和 Software AG 的 ADABAS。 
目前 已 提出 了 者 干 对 关系 模型 的 扩展 ， 例 如 
© 捕获 数据 的 更 确切 的 语义 (如 Codd, 1979). 
e HFM) MAA (如 Stonebraker and Rowe，1986 )。 
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e 支持 推理 能 力 (如 Gardarin and Valduriez, 1989 ). 
第 27 ~ 28 章 将 讨论 对 象 DBMS. 


4.2 ”基本 术语 


关系 模型 是 基于 数学 中 的 关系 (relation) 的 概念 ， 在 此 关系 用 表 表 示 。Codd 作为 一 位 
训练 有 素 的 数学 家 ， 他 习惯 使 用 数学 术语 ， 主 要 取 自 集合 论 与 谓词 逻辑 。 在 本 节 中 将 对 关系 
模型 的 常用 术语 和 基本 概念 进行 介绍 。 


4.2.1 关系 数据 结构 


| 关系 | 关系 是 由 行 和 列 组 成 的 表 。 


RDBMS 要 求 用 户 感 知 到 的 数据 库 就 是 表 。 但 需 注 意 ， 这 种 感知 只 限于 数据 库 的 逻辑 结 
构 ， 就 是 在 2.1 节 已 讨论 过 的 ANSI-SPARC 结构 的 外 部 层 和 概念 层 。 它 并 不 适用 于 数据 库 的 
物理 结构 ， 数 据 库 的 物理 结构 是 通过 多 种 存储 结构 实现 的 (参见 附录 F)。 


| 属性 | 属性 是 关系 中 命名 的 列 。 


在 关系 模型 中 ， 用 关系 保存 数据 库 所 描述 对 象 的 信息 。 关 系 用 二 维 表 表 示 ， 表 中 的 每 一 
行 对 应 一 个 单独 的 记录 ， 表 中 的 每 一 列 则 对 应 一 个 属性 。 无 论 属性 如 何 排列 ， 都 是 同一 个 关 
系 ， 因 此 它 所 表达 的 意思 也 一 样 。 

例如 ， 由 关系 Branch 所 表示 的 分 公司 信息 ， 拥 有 分 公司 的 编号 branchNo、street、city 
和 postcode 等 属性 。 由 关系 Staff 所 表示 的 员工 信息 ， 则 有 员工 的 编号 staffNo. fName, 
IName、position、sex、 出 生日 期 DOB、salary 和 员工 所 属 分 公司 的 编号 branchNo 等 属性 。 
图 4-1 中 显示 了 关系 Branch 和 关系 Staff 的 实例 。 正 如 这 个 例子 所 示 ， 表 中 的 每 一 列 都 包含 
了 某 个 属性 的 值 。 例 如 ，branchNo 列 就 包含 了 现存 的 各 分 公司 的 编号 。 

属性 


Branch 


feat Jon [ona 


关系 
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Manager 
Assistant 


关系 


Supervisor 
Assistant 
Manager 
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Assistant 


4-1 关系 Branch 和 关系 Staff 的 实例 
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| 域 | 域 是 一 个 或 多 个 属性 的 取 和 值 集合 。 


域 在 关系 模型 中 起 着 至 关 重 要 的 作用 。 必 须 给 关系 中 的 每 一 个 属性 定义 一 个 域 。 不 同 
属性 的 域 可 以 互 不 相同 ， 也 可 以 让 两 个 或 两 个 以 上 的 属性 共用 同一 个 域 。 图 4-2 中 显示 了 关 
系 Branch 和 关系 Staff 中 某 些 属性 的 域 。 注 意 ， 域 中 的 某 些 值 可 能 在 相应 属性 的 当前 值 中 未 
出 现 。 
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图 4-2 关系 Branch 和 关系 Staff 中 某 些 属性 对 应 的 域 


域 的 概念 十 分 重要 ， 因 为 用 户 可 以 通过 它 来 集中 定义 属性 取 值 的 含义 与 范围 。 因 此 ， 当 
系统 执行 关系 操作 时 ， 就 有 更 多 的 信息 可 利用 ， 从 而 避免 语义 错误 的 操作 。 例 如 ， 将 一 个 街 
道 名 与 一 个 电话 号 码 进 行 比较 是 无 意义 的 ， 尽 管 这 两 个 属性 所 定义 的 域 都 是 字符 串 。 另 一 方 
面 ， 房 产 的 月 租金 与 它 被 租用 的 月 数 有 着 不 同 的 域 (前 者 是 货币 值 ， 后 者 则 是 整数 值 )， 但 
分 别 来 自 这 两 个 域 的 值 从 人 逻辑 上 来 说 仍然 可 以 进行 乘法 操作 。 这 两 个 例子 说 明 域 概念 的 完全 
实现 不 是 那么 简单 的 事 ， 因 此 ,许多 RDBMS 并 没有 完全 实现 对 域 的 支持 。 


| 元 组 | 关系 中 的 每 一 行 称 为 元 组 。 


关系 的 元 素 就 是 表 中 的 行 或 者 说 是 元 组 。 在 关系 Branch 中 ， 每 一 行 包 含 四 个 值 ， 每 个 
值 都 对 应 着 一 个 属性 。 无 论 元 组 如 何 排列 ， 都 是 同一 个 关系 ， 因 此 所 表达 的 意思 也 一 样 。 

关系 的 结构 、 域 说 明 以 及 所 有 取 值 约束 ， 统 称 为 关系 的 内 涵 (intension)， 它 通常 是 固定 
的 ， 除 非 关 系 的 意义 发 生 改 变 而 需要 加 入 另外 的 属性 。 元 组 集 称 为 关系 的 外 延 (extension) 
或 状态 〈state)， 它 经 常 发生 改变 。 


| 维 数 | 关系 的 维 数 是 指 关 系 所 包含 属性 的 个 数 。 


图 4-1 所 示 的 关系 Branch 有 四 个 属性 ， 或 者 说 维 数 为 4。 这 就 意味 着 ， 表 中 的 每 一 行 都 
是 一 个 四 元 组 ， 包 含 四 个 值 。 只 有 一 个 属性 的 关系 的 维 数 为 1， 称 为 一 元 关系 或 是 一 元 组 。 
有 两 个 属性 的 关系 称 为 二 元 关系 ， 有 三 个 属性 的 关系 称 为 三 元 关系 ， 这 之 后 的 一 般 统称 为 n 
元 关系 。 关 系 的 维 数 是 关系 内 涵 的 性 质 之 一 。 


| 基数 | 关系 的 基数 是 指 它 所 包含 元 组 的 个 数 。 


反 过 来 说 ， 元 组 的 个 数 称 为 关系 的 基数 ， 在 添加 或 删除 元 组 时 ， 基 数 就 会 发 生 改 变 。 基 
数 是 关系 外 延 的 一 个 性 质 ， 它 由 给 定时 刻 特定 的 关系 实例 所 决定 。 最 后 ， 是 对 关系 数据 库 的 
EX, 
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| 关系 数据 库 | 关系 数据 库 是 具有 不 同 关系 名 的 规范 化 关系 的 集合 。 


关系 数据 库 包 含 一 组 有 合适 结构 的 关系 。 在 这 里 把 这 种 合适 性 称 为 规范 化 。 对 规范 化 的 
讨论 将 在 第 14、15 章 进行 。 
可 选 术语 

关系 模型 的 术语 相当 混乱 。 前 面 已 经 介绍 了 两 套 术语 。 实 际 上 ， 有 时 还 会 用 到 它 的 第 三 
套 术 语 : 关系 可 能 被 称 为 文件 ， 元 组 被 称 为 
记录 ， 属 性 则 被 称 为 字段 。 这 套 术语 来 源 于 
这 样 一 个 事实 ， 在 物理 结构 中 ，RDBMS 可 能 
把 每 个 关系 保存 在 一 个 文件 里 。 表 4-1 总 结 了 
关系 模型 中 的 不 同 术 语 。 


4.2.2 ”数学 中 的 关系 


为 了 理解 关系 这 一 术语 的 真正 含义 ， 需 要 对 数学 中 的 一 些 概念 稍 做 复习 。 假 设 有 两 个 
ES D 5D, HF D,={2, 43, D={1, 3, 5}。 这 两 个 集合 的 笛 卡 儿 乘 积 DiXD; 是 一 个 
有 序 对 的 集合 ， 每 个 有 序 对 中 的 第 一 个 元 素 都 是 Di 中 的 成 员 ， 第 二 个 元 素 是 D: 中 的 成 员 ， 
D1XD; 中 包含 了 所 有 这 样 的 有 序 对 。 换 一 种 表达 方式 就 是 ， 找 出 所 有 第 一 个 元 素来 自 Di, 
第 二 个 元 素来 自 D: 的 元 素 组 合 。 在 这 个 例子 中 ， 可 以 得 出 : 

DiXD;= {(2, 1), (2, 3), (2, 5), (4, 1), (4, 3), (4, 5)} 

这 个 笛 卡 儿 乘 积 的 任何 子 集 都 是 一 个 关系 。 例 如 ， 可 以 找到 如 下 的 一 个 关系 R: 

R=, D 4, "D3 
可 以 通过 一 些 选 择 条 件 来 说 明 关 系 中 将 会 有 哪些 有 序 对 。 例 如 ， 如 果 看 出 R 是 所 有 第 二 个 
元 素 为 1 的 有 序 对 的 集合 ， 就 能 够 将 R 表示 成 : 

R= {(x, y) | xED', yED;,, y= 1} 
使 用 同样 的 集合 D!|、D;，， 还 可 以 形成 男 一 种 关系 S$， 它 包含 所 有 这 样 的 有 序 对 ， 其 中 第 一 个 
元 素 是 第 二 个 元 素 的 两 倍 。 因 此 ， 可 以 将 $ 表示 如 下 : 

S= {(x, y) | x©Di, yED,, x=2y} 
或 者 ， 用 这 个 实例 ， 

S= {(2,1)} 
因为 在 这 个 笛 卡 儿 乘 积 中 只 有 一 个 有 序 对 满足 此 条 件 。 可 以 很 简单 地 将 关系 的 概念 扩展 到 三 
个 集合 上 。 假 设 有 三 个 集合 Di、D; 和 Di。 这 三 个 集合 的 笛 卡 儿 乘 积 D1XD;XD; 将 是 所 有 
这 样 的 有 序 三 元 组 的 集合 ， 有 序 三 元 组 从 D 中 取出 第 一 个 元 素 ， 从 D; 中 取出 第 二 个 元 素 ， 
KD; 中 取出 第 三 个 元 素 。 这 个 笛 卡 儿 乘 积 中 的 任何 子 集 也 是 一 个 关系 。 例 如 ， 假 设 有 : 

Di= {1, 3} D:= {2,4} D3;= {5,6} , 

D, XD, XD3= {(1,2, 5); (152,86); (545 5), (15.4, OF 2: D352; .354,.5) GB, 4;.6)} 
这 些 有 序 三 元 组 的 任何 子 集 都 是 一 个 关系 。 可 以 继续 将 三 个 集合 扩展 ， 从 而 定义 n 个 域 上 的 
一 般 关系 。 设 Dı, Dz, …, Dr 为 n 个 集合 。 它 们 的 箔 卡 儿 乘 积 定 义 如 下 : 

D; XD;X:…XD,= {(di, dz, °°, dn) | di ED, d2 E€ D;,*…, d, E Dn} 

通常 被 表示 成 : 


[[ D: 
i=] 


4-1 可 选 关系 模型 术语 
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这 个 笛 卡 儿 乘积 中 任何 元 组 的 子 集 都 是 这 n 个 集合 上 的 一 个 关系 。 注 意 ， 为 了 定义 这 些 关 
系 ， 必 须 对 取 值 集合 ( 即 域 ) 进行 说 明 。 


4.2.3 数据 库 中 的 关系 
将 上 面 所 介绍 的 概念 应 用 到 数据 库 当 中 ， 就 可 以 定义 关系 模式 。 
| 关系 模式 | 用 一 组 属性 和 域名 对 定义 的 具名 的 关系 。 


设 属 性 Ai, Ao, … ,An 对 应 的 域 分 别 为 Di Do,-*+, Dio ABA, EE {Ar:Di, Az:D,,…， 
An:Dn} 就 是 一 个 关系 模式 。 由 关系 模式 S 所 定义 的 关系 R 是 一 组 从 属性 名 到 其 对 应 的 域 的 
映射 。 因此， 关系 R 就 是 如 下 n 元 组 的 集合 : 

(Adi, Az:d2,*…*, Anidn), 其 中 di E Di, d E D3 t, d,ED, 

n 元 组 的 每 个 元 素 都 由 一 个 属性 和 该 属性 的 一 个 取 值 组 成 。 当 把 关系 表示 成 一 个 表 时 ， 通 常 
会 把 属性 名 作为 每 一 列 的 标题 ， 每 一 个 元 组 则 作为 表 中 的 行 ， 以 (di, do, …, dn) 的 形式 出 现 ， 
其 中 的 每 个 值 都 取 自 适当 的 域 。 这 样 ， 就 可 以 将 关系 模式 中 的 每 个 关系 看 成 属性 对 应 域 的 笛 
卡 儿 乘积 的 子 集 。 表 则 是 这 种 关系 的 简单 表示 。 

在 前 面 的 例子 中 ， 图 4-1 所 示 的 关系 Branch 有 属性 branchNo street, city 及 postcode, 
每 个 属性 都 有 相对 应 的 域 。 关 系 Branch 是 这 些 域 的 笛 卡 儿 乘 积 的 某 个 子 集 ， 或 者 说 是 一 个 
四 元 组 的 集合 ， 这些 四 元 组 中 的 第 一 个 元 素 都 取 自 BranchNumber sk, 3% — “S70 RK ABM A 
StreetName 域 ， 等 等 。 下 面 是 这 些 四 元 组 中 的 一 个 : 

{(B005, 22 Deer Rd, London, SW1 4EH)} 


或 者 更 为 正确 的 表示 是 : 
{(branchNo: B005, street: 22 Deer Rd, city: London, postcode: SW1 4EH)} 


这 样 的 子 集 称 为 关系 实例 。 表 Branch 只 是 关系 四 元 组 的 一 种 简便 表示 方法 ， 这 些 四 元 组 给 
出 任 一 给 定时 刻 的 关系 。 这 也 是 表 中 的 行 在 关系 模型 中 被 称 为 元 组 的 原因 。 与 关系 有 模式 一 
样 ， 关 系数 据 库 也 有 模式 。 


| 关系 数据 库 模 式 | 关系 模式 的 集合 ， 集 合 中 的 每 个 关系 都 应 有 不 同 的 名 字 。 


i Ry, Rao e, Ra 为 一 系列 关系 模式 ， 那 么 就 可 以 写 出 关系 数据 库 模 式 ， 或 者 简称 关系 的 
模式 R 如 下 : 
R{Rı, Ro, =, Ra} 


424 关系 的 性 质 


一 个 关系 通常 有 如 下 性 质 : 

有 一 个 关系 名 ， 同 一 关系 模式 中 各 关系 不 能 重 名 。 

关系 中 的 每 一 个 单元 格 都 确切 包含 一 个 原子 (单个 ) 值 。 

每 个 属性 都 有 一 个 不 同 的 名 字 。 

同一 属性 中 的 各 个 值 都 取 目 相同 的 域 。 

各 元 组 互 不 相同 ， 不 存在 重复 元 组 。 

属性 的 顺序 并 不 重要 。 

理论 上 讲 , 元 组 的 顺序 也 不 重要 (但 实际 上 ， 这 个 顺序 将 影响 对 元 组 的 访问 效率 )。 
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现在 说 明 这 些 限制 的 含义 ， 参 看 图 4-1 所 示 的 关系 Branch。 因 为 每 个 单元 格 中 只 能 包含 
一 个 值 ， 那 么 在 一 个 单元 格 中 存储 分 公司 的 两 个 邮编 就 是 非法 的 。 换 句 话说， 关系 不 能 包含 
重复 组 。 满 足 这 一 性 质 的 关系 称 为 规范 化 关系 或 第 一 范式 关系 (第 14、15 章 将 讨论 范式 )。 
在 每 一 列 的 顶端 所 给 出 的 列 名 与 关系 的 各 个 属性 相对 应 。 属 性 branchNo 中 的 所 有 值 都 
是 取 自 BranchNumber 域 的 ，postcode 值 就 不 能 出 现在 这 一 列 中 。 关 系 中 不 存在 重复 的 元 组 。 
例如 ，(B005，22 Deer Rd, London, SW1 4EH) 这 一 行 就 只 能 出 现 一 次 。 
倘若 将 属性 名 与 相应 的 属性 取 值 一 起 移动 ， 就 实现 了 列 交换 。 例 如 ， 把 属性 city 和 属性 
postcode 交换 二 下， 所 得 到 的 表 仍 表示 与 原来 同样 的 关系 。 不 过 ,保持 地 址 各 元 素 按 正常 
顺序 排列 可 以 增强 可 读 性 。 同 样 ， 元 组 的 顺序 也 可 以 交换 。 因 此 ， 交 换 一 下 分 公司 B005 与 
B004 记录 的 位 置 ， 关 系 仍 是 原来 的 关系 。 
关系 的 大 部 分 特有 性 质 都 源 于 数学 中 关系 的 性 质 : 
e 当 用 简单 的 、 单 值 元 素 (如 整数 ) 的 集合 导出 笛 卡 儿 乘 积 时 ， 每 个 元 组 中 的 所 有 元 素 
都 是 单 值 的 。 类 似 地 ， 关 系 的 每 个 单元 格 中 也 只 包含 一 个 单 值 。 但 数学 意义 上 的 关 
系 无 需 规范 化 。Codd 强调 不 允许 重复 组 的 出 现 是 为 了 简化 关系 数据 模型 。 

e 在 数学 关系 中 ， 某 一 位 置 的 可 能 取 值 由 定义 该 位 置 的 集合 或 域 来 决定 。 对 应 地 ， 在 
表 中 每 一 列 的 取 值 必须 源 自 相 同 的 属性 域 。 

e 集合 中 没有 重复 的 元 素 。 同 样 ， 关 系 中 没有 重复 的 元 组 。 

e 因为 关系 是 用 集合 定义 的 ， 集 合 中 元 素 的 顺序 无 关 紧 要 ， 因 此 ， 关 系 中 元 组 的 顺序 
也 就 没有 实质 意义 了 。 

但 在 数学 关系 中 ， 元 组 中 各 个 元 素 的 顺序 是 很 重要 的 。 例 如 ， 有 序 对 ( 1, 2 ) 与 有 序 对 
(2,1) 就 大 不 相同 。 而 对 于 关系 模型 中 的 关系 则 不 一 样 ， 它 明确 要 求 属性 的 顺序 不 具备 实际 
意义 。 原 因 就 在 于 每 一 列 的 标题 已 说 明了 该 列 的 值 对 应 哪个 属性 。 这 就 意味 着 ， 关 系 内 涵 中 
列 标题 的 顺序 无 关 紧 要 ， 不 过 一 旦 选 定 了 关系 的 结构 ， 其 外 延 中 元 组 的 元 素 顺序 就 必须 与 属 
性 名 的 顺序 相 一 致 。 


425 ”关系 关键 字 


如 前 所 述 ， 关 系 中 不 会 出 现 重复 的 元 组 。 因 此 ， 可 指定 一 个 或 多 个 属性 ( 称 为 关系 关键 
字 )， 唯 一 地 标识 关系 中 的 每 个 元 组 。 在 本 节 中 ， 将 介绍 关系 关键 字 的 有 关 术 语 。 


| 超 关键 字 | 一 个 属性 或 属性 集合 ， 它 能 唯一 地 标识 出 关系 中 的 每 个 元 组 。 


超 关键 字 ( superkey) 能 唯一 标识 关系 中 的 每 个 元 组 。 但 超 关键 字 中 有 可 能 包含 多 余 属 
性 ， 但 在 一 般 情 况 下 ， 人 们 仅 对 能 唯一 标识 元 组 的 最 小 属性 集合 感 兴趣 。 


| 候选 关键 字 | 本 身 是 超 关键 字 但 其 任何 子 集 都 不 再 是 超 关键 字 。 


KAR 中 的 候选 关键 字 (candidate key) K 有 两 条 性 质 : 

e 唯一 性 : R 中 的 每 个 元 组 在 K 上 的 值 都 可 以 唯一 地 标识 该 元 组 。 

e 不 可 约 性 : K 中 的 任 一 真子 集 都 不 具备 唯一 性 。 

ov 
eee ee 给 定 一 个 city 属性 的 值 ， 可 以 确定 出 几 个 分 
公司 (例如 ， 在 London 有 两 个 分 公司 )。 这 个 属性 不 能 作为 候选 关键 字 。 另 一 方面 ， 因 
为 DreamHome 给 每 个 分 公司 分 配 了 一 e 的 分 公司 编号 ， 那 么 给 定 一 个 分 公司 编号 值 
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branchNo， 则 可 以 确定 至 多 一 个 元 组 ， 因 此 branchNo 就 是 一 个 候选 关键 字 。 同 样 postcode 
也 是 这 个 关系 中 的 候选 关键 字 。 

现在 来 看 看 关系 Viewing， 它 包含 客户 查看 房产 的 相关 信息 。 这 个 关系 中 包括 客户 编号 
(clientNo)、 房 产 编 号 (propertyNo)、 查 看 日 期 (viewDate)， 还 有 一 个 可 选择 填写 的 属性 一 一 
对 房产 的 评论 (comment)。 给 定 一 个 客户 编号 clientNo， 他 可 能 查看 过 几 处 不 同 的 房产 ， 所 
以 会 有 几 条 记录 与 之 对 应 。 同 样 ， 给 定 一 个 房产 编号 propertyNo， 也 可 能 会 有 多 个 客户 看 过 
该 房产 。 因 此 ，clientNo 和 propertyNo 都 不 能 单独 地 作为 候选 关键 字 。 但 如 果 把 clientNo 与 
propertyNo 结合 起 来 ， 则 至 多 可 标识 一 个 元 组 ， 因 此 ， 对 于 Viewing 关系 而 言 ，clientNo 和 
propertyNo 一 起 形成 了 一 个 (组合 ) 候选 关键 字 。 如 果 人 允许 客户 对 同一 房产 查看 多 次 ， 那 么 ， 
可 以 在 组 合 关键 字 中 添加 viewDate 属性 。 但 在 本 书 ， 假 设 没 这 个 必要 。 

注意 ， 一 个 关系 实例 无 法 证 明 某 个 属性 或 某 几 个 属性 的 组 合 能 否 作为 候选 关键 字 。 事 实 
上 ， 在 某 个 特定 时 刻 ， 没 有 重复 出 现 的 值 并 不 能 保证 永远 不 重复 。 但 在 一 个 关系 实例 中 就 出 
现 重复 值 的 属性 或 属性 组 合 肯 定 不 能 作为 候选 关键 字 。 确 定 候选 关键 字 时 ， 必 须 明确 这 些 属 
性 在 “现实 世界 ”中 的 含义 ， 从 而 确保 不 会 出 现 重 复 。 只 有 通过 这 种 语义 信息 才能 确定 一 种 
属性 组 合 是 否 可 以 作为 候选 关键 字 。 例 如 ， 仅 根据 图 4-1 所 示 的 数据 ， 可 能 认为 [Name (B 
员工 的 姓氏 ) 适合 作为 关系 Staff 的 候选 关键 字 。 显 然 ， 在 关系 Staff 的 这 个 实例 中 虽 只 有 一 
个 姓 White 的 员工 ， 但 完全 可 能 会 有 一 个 同样 姓 White 的 新 员工 加 入 公司 ， 那 时 Name fF 
为 候选 关键 字 就 无 效 了 。 


| 主 关键 字 (Primary key) | 被 选用 于 唯一 标识 关系 中 各 元 组 的 候选 关键 字 。 


因为 关系 中 没有 重复 元 组 ， 所 以 总 可 以 唯一 地 标识 出 每 一 行 。 这 就 意味 着 ， 每 个 关系 
总 有 一 个 主 关键 字 。 最 糟糕 的 情况 是 属性 全 集 作 为 主 关键 字 ， 但 一 般 都 存在 某 个 稍 小 的 子 集 
足以 标识 每 个 元 组 。 没 有 被 选 为 主 关键 字 的 候选 关键 字 称 为 可 替换 关键 字 (alternate key). 
如 果 在 关系 Branch 中 选择 branchNo 作为 主 关键 字 ，postcode 就 成 了 可 替换 关键 字 。 对 
Viewing 关系 而 言 ， 它 只 有 一 个 候选 关键 字 ， 即 clientNo 与 propertyNo 的 组 合 ， 因 此 这 两 属 
性 的 组 合 就 自动 地 形成 了 主 关 键 字 。 


外 部 关键 字 (Foreign key) | 当 一 个 关系 中 的 某 个 属性 或 属性 集合 与 另 一 个 关系 (也 可 能 就 
是 自己 ) 的 候选 关键 字 匹 配 时 ,就 称 这 个 属性 或 属性 集合 为 外 部 关键 字 。 


当 一 个 属性 出 现在 两 个 关系 中 时 ， 它 往往 表示 这 两 个 关系 中 对 应 元 组 之 间 的 某 种 联系 。 
例如 ， 属 性 branchNo 同时 出 现在 关系 Branch MIKA Staff 中 ， 目 的 就 是 将 每 个 分 公司 与 在 
此 分 公司 工作 的 员工 情况 联系 在 起 来 。branchNo 是 关系 Branch 的 主 关键 字 。 但 在 关系 Staff 
中 属性 branchNo 只 是 为 了 将 员工 与 他 所 属 的 分 公司 联系 起 来 。 在 关系 Staff 中 ，branchNo 
就 是 一 个 外 部 关键 字 。 或 者 说 关系 Staff 中 的 属性 branchNo 指向 主 关 系 Branch 的 主 关 键 
字 一 一 属性 branchNo。 这 些 公 有 属性 在 执行 数据 操作 时 将 扮演 重要 角色 ， 在 下 一 章 中 会 讨 
论 这 一 问题 。 


426 ”关系 数据 库 模 式 的 表示 


关系 数据 库 是 由 一 些 规范 化 关系 所 组 成 的 。 对 应 DreamHome 案例 的 部 分 关系 模式 
如 下 : 
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Branch (branchNo, street, city, postcode) 

Staff (staffNo, fName, IName, position, sex, DOB, salary, branchNo) 

PropertyForRent (propertyNo, street, city, postcode, type, rooms, rent, ownerNo, 
staffNo, branchNo) 

Client (clientNo, fName, IName, telNo, prefType, maxRent, eMail) 

PrivateOwner (ownerNo, fName, IName, address, telNo, eMail, password) 

Viewing (clientNo, propertyNo, viewDate, comment) 

Registration (clientNo, branchNo, staffNo, datejoined) 


关系 模式 的 习惯 表示 法 是 ， 给 出 关系 名 ， 并 在 后 面 的 圆 括号 中 列 出 关系 的 属性 名 。 一 般 
用 下 划 线 标 出 主 关 键 字 。 概 念 模型 (或 者 说 概念 模式 ) 是 指数 据 库 中 所 有 这 种 模式 的 集合 
图 4-3 显示 了 关系 模式 的 一 个 实例 。 


Branch 


Cr or fpo 


22 Deer Rd SW1 4EH 


Ee ea fea aeea 


Manager l-Oct-45 









London 



















16 Argyll St | Aberdeen | AB2 3SU Assistant 10-Nov-60 
163 Main St | Glasgow | G11 9QX Supervisor 24-Mar-58 
32 Manse Rd | Bristol BS99 INZ Assistant | F 19-Feb-70 





56 Clover Dr | London | NW106EU Manager 3-Jun-40 


Assistant 13-Jun-65 





PropertyForRent 


rere o [on ore [oon ree oane 


16 Holhead 


6 Argyll St 


6 Lawrence St 
2 Manor Rd 


18 Dale Rd 


5 Novar Dr 


Aberdeen 
London 
Glasgow 
Glasgow 
Glasgow 
Glasgow 


AB7 5SU 
NW2 
G11 9QX 
G32 4QX 
G12 

G12 9AX 





Client 


0207-774-5632 
PAE 0141-848-1825 
Ritchie | 01475-392178 
Tregear | 01224-196720 


john.kay@gmail.com 
astewart@hotmail.com 
mritchie0 1|@yahoo.co.uk 
maryt@hotmail.co.uk 


Keogh | 2 Fergus Dr, Aberdeen AB2 7SX | 01224-861212 | jkeogh@thh.com 

Farrel | 6 Achray St, Glasgow G32 9DX | 0141-357-7419 | cfarrel@gmail.com 
(141-943-1728 | tinam@hotmail.com 
0141-225-7025 | tony.shaw@ark.com 





Viewing Registration 


24-May-13 | too small 2-Jan- 13 
20-Apr-13 | too remote SG3 11-Apr-12 
26-May-13 ) SG 16-Nov-11! 


14-May-13 | no dining room “R62 7 : 7-Mar-12 
28-Apr-13 





图 4-3 DreamHome 租赁 数据 库 的 实例 
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43 ”完整 性 约束 


在 前 面 的 章节 中 讨论 了 关系 数据 模型 的 结构 。 如 2.3 节 所 述 ， 一 个 数据 模型 还 有 其 他 两 
个 部 分 : 一 是 操作 部 分 ， 定 义 了 人 允许 对 数据 进行 的 操作 类 型 ; 二 是 一 组 完整 性 约束 ， 它 确保 
数据 的 正确 性 。 本 节 将 讨论 关系 的 完整 性 规则 ， 在 下 一 章 中 再 讨论 可 以 对 关系 进行 的 各 种 
操作 。 

在 4.2.1 节 中 ， 我 们 已 经 看 到 了 关于 完整 性 约束 的 一 个 实例 : 由 于 每 个 属性 都 具有 一 
个 关联 的 域 ， 因 此 就 存在 这 样 一 条 限制 ， 称 为 域 约 束 (domain constraint)， 限 定 了 关系 中 
各 个 属性 的 取 值 集合 。 此 外 ， 还 有 两 个 重要 的 完整 性 规则 ， 它 们 适用 于 数据 库 中 的 所 有 实 
例 。 关 系 模 型 的 这 两 条 主要 规则 就 是 实体 完整 性 (entity integrity) 和 引用 完整 性 (referential 
integrity)。 其 他 的 完整 性 约束 还 有 多 样 性 (multiplicity) 和 一 般 性 约束 ( general constraint), 
前 者 留待 12.6 节 讨论 ， 后 者 将 在 4.3.4 节 中 予以 介绍 。 在 定义 实体 完整 性 和 引用 完整 性 之 
前 ， 必 须 对 空 (null) 的 概念 有 所 了 解 。 


43.1 空 


| 空 | 代表 对 一 个 元 组 当前 取 值 还 不 知道 或 是 不 可 用 的 属性 值 。 


空 可 以 表示 “不 知道 ”这 个 逻辑 值 。 它 还 可 以 指 对 于 某 个 特定 元 组 无 值 可 用 ， 或 者 它 仅 
仅 意 味 着 尚未 提供 任何 值 。 空 是 处 理 不 完整 数据 或 异常 数据 的 一 种 方法 。 但 空 不 等 价 于 零 值 
或 空格 所 组 成 的 字符 串 。 零 值 和 空格 都 是 实际 存在 的 值 ， 而 空 则 表示 没有 这 人 么 一 个 值 。 因 
此 ， 应 该 将 空 与 其 他 值 区 别 对 待 。 一 些 人 使 用 了 “ 空 值 ”这 个 术语 ， 但 因为 空 并 不 是 一 个 
值 ， 只 是 没有 值 的 一 种 表示 ， 因 此 本 书 并 不 赞同 用 “ 空 值 ”这 个 词 。 

例如 ， 在 如 图 4-3 所 示 的 Viewing 关系 中 ，comment 属性 在 租户 参观 房产 并 向 业主 反馈 
评论 之 前 都 是 未 定义 的 。 如 果 没 有 空 这 个 概念 ， 就 需要 引进 一 个 默认 值 来 代表 这 种 状态 ,或 
是 添加 一 些 对 用 户 来 说 毫 无 意义 的 额外 属性 。 在 本 例 中 ， 可 以 试 着 用 “一 1” 这 个 值 来 代表 
空 评论 。 当 然 也 可 给 Viewing 关系 加 入 一 个 新 的 hasCommentBeenSupplied 属性 ， 如 果 给 出 
了 评论 ， 这 个 值 为 Y Ge), 反之 为 N ( 否 )。 这 两 种 方法 都 会 给 用 户 囊 来 混乱 。 

空 可 能 会 导致 执行 问题 ， 因 为 关系 模型 是 基于 一 阶 谓词 演算 的 ， 谓 词 演 算是 二 值 逻 辑 ， 
或 称 布尔 逻辑 ， 因 此 只 允许 两 个 值 的 存在 ， 或 为 真 ， 或 为 假 。 人 允许 空 存在 意味 着 ， 必 须 采 用 
一 种 多 值 逻辑 ， 例 如 三 值 或 四 值 迎 辑 (Codd, 1986, 1987, 1990). 

在 关系 模型 中 使 用 空 一 直 是 个 有 争议 的 问题 。Codd 将 空 看 成 模型 中 一 个 不 可 分 割 的 部 
分 (Codd，1990 )， 而 一 些 人 则 认为 这 种 方法 易 产生 误导 ， 他 们 相信 大 们 没有 充分 理解 丢失 
信息 的 问题 ， 从 而 无 法 找到 一 个 满意 的 解决 方案 ， 因 此 ， 将 空 引 入 关系 模型 亦 属 草率 〈 比 如 
见 ，Date，1995 ) 。 

下 面 给 出 两 条 关系 完整 性 规则 的 定义 。 


4.3.2 ”实体 完整 性 


第 一 条 完整 性 约束 针对 基本 关系 的 主 关 键 字 。 在 这 里 ， 将 基本 关系 定义 为 与 概念 模式 
(参见 2.1 节 ) 中 某 个 实体 相对 应 的 一 个 关系 。 在 4.4 节 中 会 给 出 它 的 精确 定义 。 


| 实体 完整 性 | 在 基本 关系 中 ， 主 关键 宇 的 属性 不 能 为 室 。 


84 Bax KARHBS BS 


根据 定义 ， 主 关键 字 是 能 对 元 组 进行 唯一 标识 的 最 小 标识 符 。 这 就 意味 着 主 关键 字 的 任 
何 子 集 都 不 足以 唯一 标识 元 组 。 如 果 人 允许 主 关 键 字 的 某 个 部 分 为 空 ， 就 暗示 了 并 不 是 所 有 属 
性 都 是 标识 元 组 所 必需 的 ， 与 主 关键 字 的 定义 相 矛 盾 。 例 如 ， 当 branchNo 作为 关系 Branch 
的 主 关键 字 时 ， 就 不 能 在 Branch 关系 中 插入 一 个 branchNo 属性 值 为 空 的 元 组 。 再 例如 ， 关 
系 Viewing 为 组 合 主 关键 字 ， 它 是 客户 编号 (clientNo) 与 房产 编号 ( propertyNo) WHA, 
因此 ,在 Viewing 关系 中 不 能 插入 一 个 clientNo 值 为 空 、propertyNo 值 为 空 或 是 两 者 都 为 空 
的 元 组 。 

如 果 对 这 条 规则 进行 详细 的 分 析 ， 就 会 发 现 一 些 奇 怪 的 地 方 。 第 一 ， 既 然 候 选 关 键 字 
同样 也 可 以 唯一 地 标识 元 组 ， 为 什么 这 条 规则 只 用 在 主 关 键 字 上 ， 而 没有 更 一 般 地 推广 到 
候选 关键 字 中 ?第 二 ， 为 什么 这 条 规则 只 对 基本 关系 起 约束 作用 ? 例如， 使 用 图 4-3 所 示 的 
Viewing 关系 中 的 数据 ， 考 虑 这 样 一 个 查询 一 一 “ 列 出 查看 记录 中 的 所 有 评论 ”。 这 个 查询 
将 会 生成 一 个 由 属性 comment 组 成 的 一 元 关系 。 根 据 定 义 ， 这 个 属性 就 是 结果 关系 的 主 关 
键 字 了 ， 但 它 包 含 了 空 (对 应 客户 CR56 在 PG36 和 PG4 中 的 查看 记录 )。 因 为 这 个 关系 不 
是 一 个 基本 关系 ， 所 以 模型 允许 主 关键 字 为 空 。 基 于 这 些 不 合 常 理 的 地 方 ， 现 在 有 一 些 人 试 
图 对 这 条 规则 进行 重新 定义 (例如 ，Codd，1988; Date, 1990). 


4.3.3 引用 完整 性 
第 二 条 完整 性 规则 是 针对 外 部 关键 字 的 。 


引用 完整 性 | 如 果 在 关系 中 存在 某 个 外 部 关键 字 ， 则 它 的 值 或 与 主 关 系 中 某 个 元 组 的 候选 
关键 字 取 值 相 等 ,或 者 全 为 空 。 


Gili, KA Staff 中 的 branchNo 指 癌 主 关 系 Branch 中 的 branchNo 属性 。 那 么 它 就 不 能 
创建 出 一 个 分 公司 编号 为 B025 的 员工 记录 ， 除 非 在 Branch 关系 中 已 经 有 了 分 公司 编号 为 
B025 的 记录 。 但 是 ， 可 以 创建 一 条 分 公司 编号 为 空 的 新 员工 记录 ， 用 来 表示 公司 加 入 了 一 
名 新 员工 ， 但 他 还 没 被 分 配 到 某 个 特定 的 分 公司 中 。 


4.3.4 一 般 性 约束 


| 一 般 性 约束 | 由 数据 库 用 户 或 数据 库 管 理 员 所 指定 的 附加 规则 ， 它 约束 企业 的 某 些 方面 。 


还 可 以 让 用 户 来 指定 数据 所 需 满 足 的 附加 约束 。 例 如 ， 如 果 在 一 个 分 公司 中 工作 的 员工 
人 数 不 能 超过 20 位 这 个 上 限 ， 那 么 用 户 就 可 以 说 明 这 个 一 般 性 约束 ， 并 由 DBMS 来 强制 执 
行 。 在 这 个 例子 中 ， 如 果 一 个 给 定 分 公司 的 当前 员工 数 已 经 达到 20， 就 不 能 在 关系 Staff 中 
往 这 个 分 公司 添加 新 员工 了 。 遗 憾 的 是 ， 对 一 般 性 约束 的 支持 程度 总 是 因 系 统 而 异 。 在 第 7 
章 和 第 18 章 中 将 对 关系 完整 性 的 实现 进行 讨论 。 


4.4 视图 


在 第 2 章 提 到 的 ANSI-SPARC 三 层 结构 中 ， 描 述 了 数据 库 结 构 呈 现在 特定 用 户 面 前 的 
一 个 外 部 视图 。 在 关系 模型 中 ,“ 视 图 ”( view) 这 个 词 的 含义 稍 有 不 同 。 它 不 完全 是 用 户 看 
到 的 外 部 模型 ， 它 指 虚 关系 或 称 导 出 关系 ， 即 无 需 单独 存在 ， 必 要 时 可 从 一 或 多 个 基本 关 
系 中 动态 地 将 其 导出 。 因 此 ， 一 个 外 部 模型 可 以 由 基本 关系 (概念 级 ) 和 基本 关系 导出 的 视 
图 共同 组 成 。 本 节 简 单 介 绍 了 关系 系统 中 的 视图 。 在 7.4 节 中 ， 将 对 视图 进行 更 为 详细 的 讨 
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论 ， 还 会 对 视图 的 创建 和 它 在 SQL 中 的 使 用 进行 介绍 。 


4.4.1 术语 
迄今 为 止 ， 本 章 中 所 涉及 的 关系 都 是 基本 关系 。 


基本 关系 (base relation) | 与 概念 模式 中 的 一 个 实体 相对 应 的 具名 关系 ， 它 的 元 组 都 存储 在 
数据 库 的 物理 结构 中 。 


可 以 根据 基本 关系 定义 视图 。 


视图 | 对 一 个 或 多 个 基本 关系 进行 关系 操作 得 到 的 动态 结果 。 视 图 是 一 个 无 需 存 在 于 数据 
库 当 中 ， 但 却 可 以 根据 某 个 特定 用 户 需 要 在 必要 时 再 生成 的 虚 关 系 。 


视图 是 一 个 因 用 户 而 存在 ， 并 呈现 在 用 户 面前 的 关系 ， 可 以 把 它 当 作 基 本 关系 进行 操 
作 ， 但 与 基本 关系 不 同 的 是 ， 它 并 不 真正 存在 于 存储 硕 中 《虽然 它 的 定义 存储 在 系统 目录 
中 )。 视 图 的 内 容 被 定义 成 基于 一 个 或 多 个 基本 关系 的 查询 。 对 视图 所 进行 的 任何 操作 都 目 
动 地 转换 成 对 导出 它 的 关系 进行 操作 。 视 图 是 动态 的 ， 这 意味 着 ， 对 导出 视图 的 基本 关系 的 
修改 将 立即 反映 到 视图 上 。 当 用 户 对 视图 做 允许 的 修改 时 ， 这 些 修 改 将 作用 到 基本 关系 上 。 
本 方 将 对 视图 的 用 途 进行 描述 ， 并 简单 分 析 通 过 视图 对 数据 进行 更 新 的 一 些 约束 。 视 图 的 定 
义 和 处 理 过 程 将 在 7.4 市 中 介绍 。 


44.2 WAKAR 


需要 视图 机 制 的 原因 有 : 
e 通过 对 特定 用 户 隐藏 部 分 数据 库 信 息 ， 提 供 了 一 个 强大 而 灵活 的 安全 机 制 。 如 果 属 
性 或 元 组 不 出 现在 其 视图 中 ， 用 户 将 无 从 得 知 其 存在 。 
e 人 允许 用 户 根据 自己 的 需求 自 定 义 访问 数据 的 方法 ， 因 此 不 同 的 用 户 可 以 通过 不 同 的 
途径 同时 看 到 相同 的 数据 。 
e 可 以 简化 对 基本 关系 的 复杂 操作 。 人 例如， 如果 一 个 视图 被 定义 成 两 个 关系 的 联合 
(连接 ， 参 见 5.1 节 )， 用 户 就 可 以 在 该 视图 上 执行 更 为 简单 的 操作 ， 而 这 个 操作 将 会 
被 DBMS 转换 成 在 该 连接 上 的 等 价 操作 。 
可 以 让 视图 支持 用 户 所 熟悉 的 外 部 模型 。 例 如 : 
se 用 户 可 能 需要 这 样 的 Branch 元 组 ， 它 包含 经 理 的 姓名 和 Branch 中 已 有 的 其 他 属性 。 
可 以 将 关系 Branch 与 关系 Staff 连接 起 来 ， 并 限定 关系 Staff 中 员工 的 职位 必须 是 
“Manager”， 从 而 创建 所 需 视图 。 
e 应 该 让 一 些 员工 看 不 到 Staff 的 元 组 中 的 salary 属性 。 
o 可 以 对 属性 进行 重 命 名 ， 或 是 更 改 属 性 的 顺序 。 例 如 ， 某 个 用 户 习 惯 把 分 公司 的 属 
性 branchNo 的 全 称 Branch Number 写 出 来 ， 那 么 ， 可 以 通过 自 定义 的 视图 让 他 看 到 
那样 的 列 标题 。 
e 某 些 员工 应 该 只 能 看 到 他 们 所 管理 的 房产 记录 。 
虽然 这 些 例子 足以 说 明 视 图 提供 了 逻辑 数据 独立 性 (参见 2.1.5 97), 但 实际 上 ， 视 图 还 
提供 了 更 为 重要 的 一 类 逻辑 数据 独立 性 ， 即 允许 概念 模式 的 重组 。 例 如 ， 如 果 在 某 个 关系 中 
添加 了 一 个 新 的 属性 ， 当 前 用 户 可 以 完全 不 知道 它 的 存在 ， 只 要 他 们 的 视图 不 涉及 该 属性 。 
表 则 ， 一 个 现 有 的 关系 被 重新 排列 或 是 被 拆 分 ,仍然 可 以 通过 定义 视图 而 让 用 户 按 原样 使 用 
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数据 库 。 在 7.4.7 节 中 将 看 到 这 样 的 例子 ， 那 时 将 对 视图 的 优 缺点 进行 更 为 详细 的 讨论 ; 


44.3 ”视图 的 更 新 


对 某 个 基本 关系 的 所 有 更 新 应 该 立即 反映 到 涉及 这 个 基本 关系 的 视图 中 。 同 样 ， 如 果 一 
个 视图 被 更 新 ， 那 么 它 涉及 的 底层 基本 关系 也 应 该 反映 出 这 种 变化 。 但 通过 视图 进行 更 新 存 
在 一 些 约束 。 下 面 给 出 大 多 数 系统 允许 通过 视图 进行 更 新 操作 的 条 件 : 

se 如 果 视 图 由 一 个 基本 关系 的 简单 查询 生成 ， 而 且 它 还 包含 了 基本 关系 中 的 主 关 键 字 

或 是 候选 关键 字 ， 则 可 以 通过 这 个 视图 进行 更 新 操作 。 

© 不 允许 对 涉及 多 个 基本 关系 的 视图 进行 更 新 。 

e 如 果 视 图 的 生成 中 涉及 聚集 或 是 分 组 操作 ， 则 不 允许 通过 这 个 视图 进行 更 新 。 

可 以 根据 理论 上 不 可 更 新 、 理 论 上 可 更 新 和 部 分 可 更 新 来 对 视图 进行 分 类 。Furtado 与 
Casanova 在 1985 年 写 了 一 篇 关于 关系 视图 更 新 的 综述 文章 。 


本 章 小 结 

© 在 目前 使 用 的 数据 处 理 软件 中 ， 关 系数 据 库 管理 系统 (RDBMS) 占据 了 统治 地 位 ， 估 计 每 年 大 约 有 

60 亿 到 100 亿美 元 的 新 销售 许可 (如果 包 括 配 套 工具 的 销售 ， 每 年 则 有 250 亿美 元 )。 这 类 软件 基 

F E. F. Codd 所 提出 的 关系 数据 模型 ， 代 表 了 第 二 代数 据 库 管 理 系统 (DBMS). 

数学 中 和 定义 的 关系 是 两 个 或 两 个 以 上 集合 的 笛 卡 儿 乘 积 的 子 集 。 在 数据 库 术 语 中 ， 关 系 是 属性 域 的 

笛 卡 儿 乘 积 的 子 集 。 关 系 通常 被 写成 n 元 组 的 集合 ，n 元 组 中 的 每 个 元 素 都 取 值 于 适当 的 域 。 

关系 在 形式 上 表现 成 一 个 表 ， 表 中 的 每 一 行 对 应 一 个 唯一 的 元 组 ， 每 一 列 对 应 一 个 属性 。 

© 关系 的 结构 、 域 说 明 以 及 所 有 约束 ， 统 称 为 关系 的 内 涵 (intension)， 列 出 所 有 元 组 的 关系 表示 一 个 
关系 实例 或 称 数据 库 外 延 。 

e 数据 库 关 系 的 性 质 : 每 个 单元 格 都 确切 包含 一 个 原子 值 ， 属 性 名 互 不 相同 ， 同 一 属性 的 所 有 值 都 取 

目 同 一 域 ， 属性 的 顺序 并 不 重要 ， 元 组 的 顺序 也 无 关 紧 要 ， 不 存在 重复 元 组 。 

关系 的 维 是 指 其 属性 的 个 数 ， 而 基数 则 是 指 它 所 包含 元 组 的 个 数 。 一 元 关系 只 有 一 个 属性 ， 二 元 关 

系 有 两 个 属性 ， 三 元 关系 有 三 个 属性 , 元 关系 有 n 个 属性 。 

© 超 关 键 字 是 一 个 属性 或 者 属性 集合 ， 它 能 够 唯一 地 标识 出 关系 中 的 每 个 元 组 ， 候 选 关键 字 是 最 小 的 

超 关 键 字 。 主 关键 字 是 选 出 作为 各 元 组 标识 的 某 个 候选 关键 字 。 一 个 关系 通常 都 必须 有 一 个 主 关键 

字 。 外 部 关键 字 是 一 个 关系 中 与 另 一 个 关系 的 候选 关键 字 匹 配 的 属性 或 属性 集合 。 

空 代表 对 一 个 元 组 当前 取 值 还 不 知道 或 是 不 可 用 的 属性 值 。 

e 实体 完整 性 是 一 种 约束 ， 它 规定 在 基本 关系 中 ， 构 成 主 关键 字 的 属性 的 值 不 能 为 空 。 引 用 完整 性 规 
定 ， 一 个 外 部 关键 字 的 值 或 者 与 主 关 系 的 某 个 元 组 的 候选 关键 字 的 值 相同 ， 或 者 为 空 。 除 了 关系 完 
整 性 完整 性 约束 还 包括 要 求 必须 有 值 、 域 和 多 样 性 约束 ， 其 他 完整 性 约束 称 为 一 般 性 约束 。 

o 关系 模型 中 的 视图 是 指 一 个 虚 关 系 或 称 导出 关系 ， 它 是 根据 需求 由 底层 基本 关系 动态 导出 的 。 视 图 
提供 了 一 定 的 安全 性 ， 并 且 允 许 设 计 者 自 定义 用 户 模 式 。 不 是 所 有 的 视图 都 可 更 新 。 


思考 题 
4.1 结合 关系 数据 模型 ， 解 释 下 列 概念 : 
(a) 关系 


(b) 属性 


4.2 
4.3 
4.4 
4.5 


4.6 
4.7 
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(c) 域 

(d) 元 组 

(e) 内 涵 和 外 延 

(f) 维和 基数 

说 明 数 学 中 的 关系 与 关系 数据 模型 中 的 关系 之 间 的 联系 。 

说 明 关 系 与 关系 模式 之 间 的 区 别 。 什 么 是 关系 数据 库 模式 ? 

关系 有 哪些 性 质 ? 

关系 的 候选 关键 字 与 主 关 键 字 之 间 的 区 别 是 什么 ”解释 外 部 关键 字 的 含义 。 外 部 关键 字 与 候选 关 
键 字 之 间 有 何 联系 ? 举例 说 明 。 

给 出 关系 模型 两 条 主要 的 完整 性 规则 的 定义 。 说 明 为 什么 需要 强制 执行 这 些 规 则 。 
视图 是 什么 ? 视图 与 基本 关系 之 间 有 何 区 别 ? 


习题 


4.8 


以 下 列表 是 存在 某 RDBMS 中 的 数据 库 的 一 部 分 : 


Hotel (hotelNo, hotelName, city) 

Room (roomNo, hotelNo, type, price) 

Booking (hotelNo, guestNo, dateFrom, dateTo, roomNo) 
Guest (guestNo, guestName, guestAddress) 


其 中 Hotel 中 包含 酒店 的 详细 资料 ，hotelNo 是 主 关键 字 ; 

Room 中 包含 每 个 旅馆 的 房间 信息 ，(roomNo，hotelNo) 组 成 主 关键 字 ; 

Booking 中 包含 各 种 预订 资料 ，(hotelNo，guestNo，dateFrom) 组 成 主 关 键 字 ; 

Guest 中 包含 客人 的 详细 资料 ，guestNo 是 主 关键 字 。 
指出 这 个 模式 中 所 有 的 外 部 关键 字 。 说 明 在 这 些 关 系 中 如 何 运 用 实体 完整 性 规则 和 引用 完整 性 
规则 。 


4.9 ”为 这 些 关 系 写 出 一 些 遵守 关系 完整 性 规则 的 实例 表 。 为 这 个 模式 制定 一 些 适 当 的 一 般 性 约束 。 
4.10 分 析 你 当前 使 用 的 RDBMS。 确 定 系 统 提供 了 哪些 对 主 关键 字 、 候 选 关 键 字 、 外 部 关键 字 、 关 
系 完整 性 以 及 视图 的 支持 。 
4.11 在 你 当前 使 用 的 RDBMS 中 实现 上 面 给 出 的 模式 。 如 果 可 能 ， 实 现 主 关键 字 、 候 选 关 键 字 、 外 
部 关键 字 以 及 适当 的 关系 完整 性 约束 。 
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关系 代数 与 关系 演算 





本 章 我 们 主要 学 习 : 

© “关系 完备 性 ”的 含义 

© 如何 用 关系 代数 的 形式 表示 查询 

e 如 何 用 元 组 关系 演算 的 形式 表示 查询 
© 如 何 用 域 关 系 演算 的 形式 表示 查询 
© 关系 数据 操作 语言 (DML) 的 分 类 


在 前 一 章 中 介绍 了 关系 模型 主体 结构 。 正 如 2.3 节 所 讨论 的 那样 ， 关 系 模型 的 男 一 重要 
组 成 部 分 是 操作 机 制 ， 或 者 说 是 查询 语言 ， 它 负责 基础 数据 的 检索 与 更 新 。 本 章 将 重点 分 析 
关系 模型 的 查询 语言 ， 重 点 对 关系 代数 和 关系 演算 进行 讨论 ，Codd 在 1971 年 将 它们 定义 为 
关系 语言 的 基础 。 不 严格 地 说 ,可 以 将 关系 代数 描述 为 一 种 (高 级 的 ) 过 程式 语言 ， 即 可 用 
它 告 诉 DBMS 如 何 从 数据 库 的 一 个 或 多 个 关系 中 构建 新 关系 ; 而 将 关系 演算 看 成 是 一 种 非 
过 程式 语言 ， 它 用 公式 给 出 由 数据 库 中 一 个 或 多 个 关系 构成 的 新 关系 的 定义 。 然 而 ， 关 系 代 
数 与 关系 演算 形式 上 是 相互 等 价 的 ， 即 每 个 关系 代数 表达 式 都 有 一 个 等 价 的 关系 演算 表达 式 
与 之 相对 应 (反之 亦 然 )。 

演算 与 代数 都 是 形式 语言 ， 对 用 户 不 太 友 好 。 它 们 通常 用 作 其 他 高 级 关系 数据 库 数据 操 
作 语 言 ( Data Manipulation Language, DML) 的 基础 。 人 们 之 所 以 对 它们 感 兴趣 ， 是 因为 它们 
阐述 了 每 种 数据 操作 语言 所 需 的 基本 操作 ， 而 且 它 们 是 其 他 关系 语言 之 间 相 互 比较 的 标准 。 

关系 演算 用 来 衡量 关系 语言 的 选择 能 力 。 如 果 一 种 语言 可 以 生成 所有 由 关系 演算 推导 出 
来 的 关系 ， 就 称 它 具 有 关系 完备 性 。 大 多 数 关 系 查 询 语言 都 具有 关系 完备 性 ， 但 它们 比 关系 
代数 或 关系 演算 更 具 表 达能 力 ， 因 为 它们 通常 还 附加 了 完成 计数 、 求 和 以 及 排序 等 功能 的 
操作 。 
| 本 章 结构 

5.1 节 分 析 关 系 代 数 。5.2 节 讨 论 关 系 演算 的 两 种 形式 : 元 组 关系 演算 和 域 关 系 演算 。5.3 
节 将 对 一 些 其 他 的 关系 语言 进行 简单 的 介绍 。 本 章 将 使 用 图 4-3 所 示 的 DreamHome 数据 库 
实例 说 明 这 些 操 作 。 

第 6 一 9 章 对 SQL (结构 化 查询 语言 ) 进行 分 析 ，SQL 基于 元 组 关系 演算 构造 ， 它 是 
RDBMS 形式 上 和 事实 上 的 标准 语言 。 附 录 M 将 讨论 QBE (仿效 实例 查询 )， 它 是 另外 一 种 
相当 流行 的 可 视 化 RDBMS 查询 语言 ， 它 部 分 基于 域 关 系 演算 。 


5.1 关系 代数 
关系 代数 是 一 种 纯 理 论语 言 ， 它 定义 了 一 些 操 作 ， 运 用 这 些 操作 可 以 从 一 个 或 多 个 关 


¢ 





PSY RAEKMSRARH 89 


系 中 得 到 为 一 个 关系 ， 而 不 改变 原 关 系 。 因 此 ， 它 的 操作 数 和 操作 结果 都 是 关系 ， 而 且 一 个 
操作 的 输出 可 以 作为 为 一 个 操作 的 输入 。 故 而 关系 代数 的 一 个 表达 式 中 可 以 藤 套 男 一 个 表达 
式 ， 就 像 算 术 运 算 一 样 。 这 种 性 质 称 为 闭 包 (closure): 关系 在 关系 代数 下 是 封闭 的 ， 正 如 
数 在 算术 运算 下 是 封闭 的 一 样 。 

关系 代数 是 一 种 每 次 一 关系 (或 集合 ) 的 语言 ， 即 用 一 条 不 带 循环 的 语句 处 理 ， 结 果 也 
是 由 所 有 元 组 组 成 的 整个 关系 ， 当 然 ， 绪 果 关系 中 的 元 组 可 能 来 目 参与 运算 的 多 个 关系 。 关 
系 代数 运算 的 语法 形式 有 好 几 种 ， 本 书 采 用 了 一 套 通 用 的 符号 表示 方法 ， 但 并 没有 进行 严 
格 的 形式 定义 。 有 兴趣 的 读者 可 以 参见 Ullman 在 1988 年 所 提出 的 一 套 更 为 形式 化 的 语法 
结构 。 

关系 代数 中 包含 了 许多 运算 。Codd (1972a) 首先 提出 了 八 个 运算 ,现在 又 发 展 了 一 些 
其 他 的 运算 。 关 系 代数 中 有 五 个 基本 运算 ， 即 选择 、 投 影 、 笛 卡 儿 乘积 、 集 合并 、 集 合 差 ， 
它们 能 实现 大 多 数 人 们 感 兴趣 的 数据 检索 操作 。 此 外 ， 还 有 连接 、 集 合 交 、 除 运算 等 ， 它 们 
都 可 以 通过 五 个 基本 运算 表示 出 来 。 图 5-1 说 明了 每 个 运算 的 功能 。 


PxQ 


P Q 
8 


a ) 选择 b) 投影 c) 笛 卡 儿 乘 积 
RUS | RNS R-S 


crc crf Bf 









d) 并 e) 交 
T U TU T> U 
ABa [pic] Aa a 
eE fis) GEE = 
g) 自然 连接 h ) 半 连 接 i) 左 外 连接 


图 5-1 关系 代数 运算 的 功能 
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j) 除法 〈 阴影 部 分 ) 除法 的 例子 
5-1 (2%) 
选择 和 投影 运算 都 是 一 元 运算 ， 因 为 它们 只 对 一 个 关系 进行 运算 。 其 他 的 运算 则 是 作用 
在 两 个 关系 上 ， 因 此 称 为 二 元 运算 。 在 下 面 给 出 的 定义 中 ，R 和 $ 代表 两 个 关系 ， 它 们 分 别 
定义 了 属性 A= (a1, a2, °°", ay) All B= (bi, bo, … , bi) 


5.1.1 一 元 运算 
先 来 讨论 关系 代数 中 的 两 个 一 元 运算 : 选择 和 投影 。 
选择 (或 限制 ) 


gpredicate(R) | 选择 运算 作用 于 单个 关系 R， 得 到 一 个 新 关系 ， 它 由 及 中 满足 特定 条 件 ( 谓 
#4], predicate) 的 元 组 组 成 。 


| 例 5.1 >> 选择 运算 

列 出 工资 多 于 10000 英镑 的 所 有 员工 。 

T saiary > 10000( Staff) 

在 这 个 例子 中 ,输入 关系 是 Staff， 谓 词 是 salary>10000。 通 过 选择 运算 定义 了 一 个 新 
的 关系 ， 它 只 包含 关系 Staff 中 工资 多 于 10000 英镑 的 元 组 。 这 个 运算 的 结果 如 图 5-2 所 示 。 
可 以 运用 逻辑 运算 符 人 (与 )、V (或 ) 和 一 CE) 来 生成 更 为 复杂 的 谓词 。 « 


ee ne ie Ae ee 


White | Manager 


Z 










10-Nov-60 oth 
Brand | Manager 
从 Staff KA PIE salary > 10000 的 元 组 
投影 


Ta, …, an(R) | 投影 运算 作用 于 单个 关系 RR， 得 到 由 R 的 一 个 各 直子 集 构 成 的 新 关系 ， 该 
垂直 子 集 抽 取 有 中 指定 属性 上 的 值 并 去 掉 了 重复 元 组 。 


| 例 5.2 D 投影 运算 

产生 仅 显 示 staffNo, fName, [Name 和 salary 信息 的 员工 工资 列表 。 

1 ,wmvo, Mame, Name, salary (Staff) 

在 这 个 例子 中 ， 投 影 运算 定义 了 一 个 新 的 关系 ， 它 只 包含 Sta 任 关系 中 指定 的 staffNo、 
fName, IName 和 salary 属性 ， 并 以 指定 的 顺序 排列 这 些 属性 。 这 个 运算 的 结果 如 图 5-3 


RSG 关系 代数 与 关系 演算 YI 


所 示 。 « 


5.1.2 ”集合 运算 
30000 


选择 和 投影 运算 都 只 是 从 单个 关系 中 提取 信息 。 显 然 还 
会 遇 到 这 样 的 情况 ， 需 要 结合 多 个 关系 中 的 信息 。 下 面 学习 
关系 代数 中 的 二 元 运算 ， 首 先 介绍 并 、 集 合 差 、 交 和 笛 卡 儿 
乘积 四 个 集合 运算 。 





4j 图 5-3 将 关系 Staff 在 staffNo, 
RUS| 两 个 关系 RR 和 S 的 并 ， 定义 了 一 个 包含 RR、S fName, IName 和 salary 
中 所 有 不 同 元 组 的 新 关系 。R 和 S 必须 具有 并 相 容 性 。 MEERE 


如 果 R 和 S 分别 有 I 个 和 J 个 元 组 ， 那么 将 这 些 元 组 并 置 在 一 个 关系 中 就 可 以 得 到 它们 
的 并 ,其 中 最 多 有 (I 十 J) 个 元 组 。 只 有 当 两 个 关系 的 模式 完全 匹配 时 ， 即 它们 有 着 同样 多 
的 属性 ， 并 且 对 应 属性 有 相同 的 域 ， 才 可 以 进行 并 运算 。 换 句 话 说， 关系 必须 具有 并 相 容 
性 。 注 意 ， 定 义 并 相 容 性 时 并 没有 涉及 属性 名 称 。 在 某 些 情况 下 ， 可 以 先 用 投影 运算 使 得 两 
个 关系 具有 并 相 容 性 。 





| 5.3» 并 运算 - 
列 出 驻 有 分 公司 或 存在 待 租房 产 的 城市 的 清单 。 
Ju(Branch) U Isw(PropertyForRent) Glasgow 
为 了 获得 具有 并 相 容 性 的 关系 ， 首 先 用 投影 运算 得 到 Branch sea 


关系 和 PropertyForRent 关系 在 属性 city 上 的 投影 ， 必 要 时 消除 重 图 5-4 基于 关系 Branch 和 
复元 组 。 然 后 使 用 并 运算 获得 新 关系 ,结果 如 图 5-4 所 示 。 «<< PropertyForRent 中 属性 
city 的 并 
集合 差 
R-S | 集合 差 运算 定义 了 一 个 新 的 关系 ， 它 由 所 有 属于 及 但 不 属于 SS 的 元 组 构成 。R 和 8 
必须 具有 并 相 容 性 。 


| 例 5.4 D) 集合 差 运算 
列 出 有 分 公司 但 无 待 租 房产 的 城市 清单 。 
I (Branch) — IT,,,(PropertyForRent) 
跟前 面 的 例子 一 样 ， 先 将 关系 Branch 和 关系 Property- 


ForRent 在 属性 city 上 投影 ， 获 得 具有 并 相 容 性 的 关系 。 再 使 用 ”图 5-5 基于 关系 Branch 和 


集合 差 运算 得 到 新 关系 ， 结 果 如 图 5-5 所 示 。 i Mei 
pi 的 集合 关 


RAS| 交 运算 定义 了 一 个 关系 ， 它 由 既 属 于 R 又 属于 S 中 的 元 组 构成 。R 和 S 必须 具备 
并 相 容 性 。 


| 例 5.5 办 交 运 算 
列 出 既 有 分 公司 又 至 少 存在 一 处 待 租房 产 的 城市 的 清单 。 
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I] j(Branch)  II.;.(PropertyForRent) 





ity 

跟前 面 的 例子 一 样 ， 先 将 关系 Branch 和 关系 PropertyForRent 

在 city 属性 上 投影 ， 获 得 具有 并 相 容 性 的 关系 。 再 使 用 交 运算 得 ick 

到 新 关系 , 结果 如 图 5-6 所 示 。 (< . Glasgow 
注意 ， 可 用 集合 差 运 算 表 示 交 运算 : 图 5-6 基于 关系 Branch 
RMNAS=R- (R=— 5) 和 关系 PropertyForRent 中 

ity Ft 
m FILER 属性 city 的 交 


RxS| 笛 卡 儿 乘积 运算 定义 了 一 个 关系 ， 它 是 关系 R 中 每 个 元 组 与 关系 S 中 每 个 元 组 并 联 
的 结果 。 
笛 卡 儿 乘 积 运算 将 两 个 关系 相 乘 ， 得 到 另外 一 个 关系 ， 它 由 两 个 关系 中 所 有 可 能 的 元 组 
对 构成 。 因 此 ， 如 果 一 个 关系 有 工 个 元 组 、N 个 属性 ， 而 另 一 个 关系 有 了 丁 个 元 组 、M 个 属性 ， 
则 它们 的 笛 卡 儿 乘 积 将 会 有 (IXJ) 个 元 组 、( N 十 M) 个 属性 。 两 个 关系 中 可 能 有 同名 属性 。 
此 时 ， 可 用 关系 名 作为 属性 名 的 前 组 ， 从 而 保证 关系 中 属性 名 的 唯一 性 。 


| 例 5.6 D) 笛 卡 儿 乘 积 
列 出 所 有 查看 过 待 租房 产 的 客户 的 姓名 和 和 评论 。 


客户 的 姓名 都 保存 在 关系 Client 中 ， 而 所 有 的 查看 资料 则 保存 在 关系 Viewing 中 。 为 了 
既 获 取 客 户 信 息 ， 又 得 到 他 们 查看 房产 后 的 评论 ， 需 要 将 这 两 个 关系 组 合 起 来 : 

Tonero, fName, name (Client)) X (TLaientno, propertyNo, comment Viewing)) 

这 个 运算 的 结果 如 图 5-7 所 示 。 现 在 得 到 的 表格 中 包含 了 一 些 多 余 的 信息 。 例 如 ， 这 个 
关系 中 的 第 一 个 元 组 就 有 两 个 不 同 的 clientNo 值 。 为 了 获取 所 需 的 列表 ， 需 要 再 执行 一 个 选 
择 运 算 ， 以 提取 Client.clientNo=Viewing.clientNo 的 元 组 。 那 么 ， 完 整 的 运算 就 是 : 


O Client.clientNo = Viewing. clientNo( (LT cient, fName, IName(Client)) x (TToiento, propertyNo, comment( Viewing))) 


too remote 
no dining room 


too small 
too remote 


no dining room 


too small 
too remote 


no dining room 


too small 
too remote 


no dining room 





图 5-7 化 简 后 关系 Client 与 关系 Viewing 的 笛 卡 儿 乘 积 
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其 结果 如 图 $-8 所 示 。 « 





图 5-8 化 简 后 关系 Client 与 关系 Viewing 的 笛 卡 儿 乘 积 的 限制 


分 解 复杂 运算 | 

关系 代数 运算 可 以 变 得 相当 复杂 。 实 际 使 用 时 ， 可 将 这 样 的 运算 分 解 成 一 系列 较为 简单 
的 关系 代数 运算 ， 并 为 每 个 中 间 表 达 式 的 结果 命名 。 一 般 通过 赋值 运算 〈 用 符号 二 表示 ) 给 
关系 代数 运算 的 结果 命名 。 这 与 一 般 编程 语言 中 的 赋值 运算 类 似 : 将 运算 右边 的 值 赋 给 左 
边 。 例 如 ， 可 以 将 前 面 的 例子 重新 写成 下 面 的 运算 : 

TempViewing(clientNo, propertyNo, comment) <— [lonero, propertyNo, comment(Viewing) 

TempClient(clientNo, fName, IName) < 一 PNo Mame. IName(Client) 

Comment(clientNo, fName, IName, vclientNo, propertyNo, comment) <— 


TempClient X TempViewing 
Result <— O dientNo = velientNo( Comment) 


此 外 ， 还 可 以 使 用 重 命名 运算 p ， 它 能 够 对 关系 代数 的 运算 结果 命名 。 重 命名 允许 将 
新 关系 中 的 每 个 属性 名 蔡 换 成 指定 的 名 称 。 


ps(E) 或 pss a, aJ(E) | 重 命名 运算 给 表达 式 忆 提供 了 一 个 新 的 名 称 S， 并 将 属性 的 名 称 替 
HER Ar, 2, t, ano 


5.1.3 连接 运算 


通常 只 需要 将 满足 特定 条 件 的 笛 卡 儿 乘 积 结合 起 来 ， 因 此 一 般 采 用 连接 运算 来 代替 笛 卡 
儿 乘 积 运算 。 连 接 运 算是 将 两 个 关系 结合 起 来 组 成 一 个 新 的 关系 ,， 它 是 关系 代数 中 一 种 重要 
的 运算 。 连 接 是 由 笛 卡 儿 乘积 导出 的 ， 相 当 于 把 连接 谓词 看 成 选择 条 件 ， 对 两 个 参与 运算 关 
系 的 笛 卡 儿 乘 积 执行 一 次 选择 运算 。 连 接 是 RDBMS 中 最 难以 高 效 实现 的 运算 之 一 ， 并 且 可 
能 导致 关系 系统 存在 固有 的 性 能 问题 。 在 23.4.3 节 将 对 连接 运算 的 实现 策略 进行 分 析 。 

连接 运算 有 多 种 形式 ， 例 如 : 

© 0 连接 

o 等 接 (0 连接 的 特例 ) 

e AMER 

e 外 连接 - 

。 FER 


9 连接 


Rep S19 连接 运算 定义 一 个 关系 ， 它 包含 和 S 的 笛 卡 儿 乘 积 中 所 有 满足 谓词 F 的 元 组 。 谓 
词 F 的 格式 为 R a 0 S. bi, 其 中 6 为 六 个 比较 运算 符 (<, <S, >j > A) Zo 


还 可 以 将 86 连接 用 基本 的 选择 运算 和 笛 卡 儿 乘积 运算 表示 为 : 
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R papS = 0,(RX S) 

因为 6 连接 是 基于 笛 卡 儿 乘 积 的 ， 所 以 它 的 维 数 是 参与 运算 的 关系 R 和 8$S 的 维 数 之 和 。 
在 谓词 F MARES (=) 的 情况 下 ,9 连接 就 变 成 了 等 接 (Equijoin)。 再 次 考虑 例 5.6 中 
的 查询 。 
| 例 5.7 D 等 接 运算 

列 出 所 有 查看 过 待 租房 产 的 客户 的 姓名 和 评论 。 

例 5.6 曾 使 用 笛 卡 儿 乘 积 和 选择 运算 来 获得 查询 结果 。 现 在 使 用 等 接 运 算 可 以 得 到 同样 
的 结果 : 

(TTeientNio, tame, IName(Client)) D4 Ciient.ciientNo = Viewing cientNo (LosieneNo, propertyNo, comment(Viewing)) 
或 

Result ¢— TempClient > Tompciient ctientNo = TempViewing dientNo TeMpViewing 


这 些 运算 的 结果 如 图 5-8 所 示 。 (< 
自然 连接 


RmS | 自然 连接 是 关系 R 和 8$S 在 所 有 公共 属性 X 上 的 等 接 。 但 在 得 到 的 结果 中 每 个 公共 属 
性 只 保留 一 次 ， 其 余 删 除 。 


自然 连接 运算 对 两 个 关系 中 所 有 具有 相同 名 称 的 属性 执行 等 接 运 算 。 自 然 连接 的 维 数 等 
于 关系 及 与 $ 的 维 数 之 和 减 去 x 中 属性 的 个 数 。 


| 例 5.8 分 自然 连接 运算 

列 出 曾经 查看 过 待 租房 产 的 所 有 客户 的 姓名 和 评论 。 

在 例 5.7 中 ,使 用 等 接 运 算 来 产生 这 个 列表 ,但 最 终 得 到 的 关系 中 连接 属性 clientNo 出 
现 了 两 次 。 使 用 上 自然 连接 则 可 以 删除 其 中 一 次 出 现 。 


(TontNo, Mame, IName (Client)) ba (Tlieneryo, propertyNo, comment( Viewing)) : 


7 clientNo | Name 
fName | IName | propertyNo comment | 
Result ¢— TempClient >< TempViewing 


、 \ 一 — Kay too remote 
这 个 运算 的 结果 如 图 5-9 所 示 。 «< Stewart too small 
i Stewart 
外 连接 i Stewart 





在 连接 两 个 关系 时 ， 经 常会 出 现 一 个 关 Tregear no dining room 
ARPA RE 0H AIK FEA — TAR PBL 图 5-9 投影 后 关系 Client 和 Viewing 的 自然 连接 
配 元 组 的 情况 ， 换 句 话 说， 就 是 这 些 元 组 在 
连接 属性 上 不 存在 匹配 值 。 但 可 能 仍 希 望 这 些 元 组 出 现在 结果 中 ， 这 时 就 要 用 到 外 连接 。 


R=>4S | (A) 外 连接 是 这 样 一 种 连接 ， 它 将 R 中 的 所 有 元 组 都 保留 在 结果 关系 中 ， 包 括 那 
些 公共 属性 与 $ 不 匹配 的 ， 不 过 ， 结 果 关 系 中 来 自 $ 的 所 有 非 公共 属性 均 取 空 。 


外 连接 在 关系 系统 中 的 应 用 相当 广泛 ， 它 是 SQL 标准 〈 参 见 6.3.7 节 ) 中 一 个 专用 的 运 
算 符 。 外 连接 的 优点 在 于 它 保留 了 一 定 的 信息 ， 也 就 是 说 ， 使 用 外 连接 可 以 将 一 些 可 能 被 其 
他 类 型 的 连接 所 遗漏 的 元 组 保留 下 来 。 
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| 例 5.9 >» 左 外 连接 运算 

生成 一 张 关于 房产 浏览 的 情况 报告 。 

在 这 个 例子 中 ， 需 要 生成 一 个 关系 ， 它 不 仅 包 括 已 经 查看 且 评论 过 的 房产 ， 还 包括 没 查 
看 过 的 房产 。 可 以 通过 如 下 所 示 的 外 连接 获取 : 

(了 ,No street, city( PropertyForRent)) >4 Viewing 

结果 关系 如 图 5-10 所 示 。 注 意 ， 因 为 结果 中 的 房产 PL94、PG21 及 PG16 未 经 查看 ， 
所 以 它们 对 应 Viewing 关系 中 的 属性 取 值 均 为 空 。 « 


paraanin Ja Joenna | rovon oomen 


16 Holhead | Aberdeen | CR56 -May-13 | too small 
16 Holhead | Aberdeen -May-13 | no dining room 
6 Argyll St London null 


6 Lawrence St | Glasgow -Apr- too remote 
6 Lawrence St | Glasgow 
2 Manor Rd | Glasgow 
18 Dale Rd | Glasgow 
5 Novar Dr | Glasgow 





图 5-10 关系 PropertyForRent 与 关系 Viewing WA (AR) 外 连接 


严格 地 说 ， 例 5.9 是 左 (自然 ) 外 连接 ， 因 为 它 在 结果 中 保留 了 左边 关系 的 所 有 元 组 。 
类 似 的 是 右 外 连接 ， 在 结果 中 保留 右边 关系 的 所 有 元 组 。 还 有 全 外 连接 ， 它 保留 了 左 、 右 两 
个 关系 中 的 所 有 元 组 ， 凡 没有 找到 匹配 元 组 的 就 在 相应 的 属性 中 填 入 空 。 

半 连 接 
Re S| 半 连 接 运算 定义 的 关系 包含 民 中 的 这 样 一 些 元 组 ， 它 们 参与 了 R 与 S 满足 谓词 
的 连接 。 

半 连 接 运 算 执 行 了 两 个 关系 的 连接 后 ， 再 将 结果 投影 到 第 一 个 参与 运算 的 关系 的 所 有 属 
性 上 。 半 连接 的 优点 之 一 是 可 减少 必须 参与 连接 的 元 组 的 数目 。 这 对 分 布 系统 的 连接 运算 非 
常 有 用 (参见 24.4.2 节 和 25.6.2 节 )。 可 以 使 用 投影 和 连接 运算 重 写 半 连 接 运 算 : 

RoS = IIA(RearS) A 是 R 中 所 有 属性 的 集合 

这 实际 上 是 一 个 半 9 连接 。 男 外 还 有 半 等 接 、 半 自然 连接 等 变形 。 


| 例 5.10 3》》 半 连接 运算 

列 出 所 有 工作 在 格拉 斯 可 分 公司 的 员工 的 全 部 资料 。 

如 果 仅 仅 想 看 到 Staff 关系 的 属性 ， 就 可 以 使 用 下 面 的 半 连 接 运 算 ， 产生 的 结果 如 
图 5-11 所 示 。 | 


Staff > Staff branchNo = Branch branchNo(O city = ‘Glasgow’ (Branch)) < 


SG37 Ann Beech | Assistant |F 10-Nov-60 | 12000 | B003 
SG14 David | Ford |Supervisor | M | 24-Mar-58 | 18000 | B003 
SG5 Susan | Brand | Manager |F | 3-Jun-40 {| 24000 | B003 


图 5-11 关系 Staff 与 关系 Branch 的 半 连 接 
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5.1.4 ”除法 运算 


除法 运算 对 于 某 些 特殊 类 型 的 查询 十 分 有 用 ， 这 种 查询 经 常 出 现在 数据 库 应 用 当 
中 。 假 设 关系 R 定义 在 属性 集合 A 上 ， 关系 S$ 定义 在 属性 集合 BB 上, HABCA(BE 
A 的 子 集 )。C=A 一 B， 即 C 是 属于 R 但 不 属于 S 的 属性 集合 。 接 下 来 给 出 除法 运算 的 
定义 。 
R:S | 除法 运算 定义 了 属性 集合 C 上 的 一 个 关系 ， 该 关系 的 元 组 与 S 中 每 个 元 组 的 组 合 都 
能 在 R 中 找到 匹配 元 组 。 


可 以 将 除法 运算 用 基本 运算 表现 为 : 

T, = IR) 

T, — II,((T, X $) — R) 

Tehe T; 
| 615.11 D 除法 运算 

列 出 查看 过 所 有 三 居室 房产 的 客户 。 

可 以 使 用 选择 运算 找 出 所 有 有 三 居室 的 房产 ,然后 用 投影 运算 生成 仅 包含 这 些 房产 的 编 
号 的 关系 。 接 着 再 使 用 除法 运算 来 获取 如 图 5-12 所 示 的 新 关系 。 


(Lisena。 propertyNo( Viewing)) = (人 wd 一 ai(PropertyForRent))) 《< 
TosentNo.propertyNo( Viewing) Noroperno( Oroemea (PropertyForRent)) 结果 





5-12 关系 Viewing 除 以 关系 PropertyForRent 的 结果 


5.1.5 ”聚集 运算 和 分 组 运算 


除了 简单 地 获取 一 个 或 多 个 关系 中 的 元 组 和 属性 外 ,我 们 还 希望 对 数据 进行 汇总 和 
聚集 运算 ， 这 类 似 于 报表 底部 的 合计 ， 或 是 对 数据 进行 分 组 运算 ， 这 类 似 于 报表 中 的 小 
计 。 前 述 的 那些 关系 代数 运算 均 不 能 完成 这 两 项 功能 ， 所 以 还 需 另 外 一 些 运算 ， 如 下 面 
所 述 。 | 


聚集 运算 


Sm(R) | 将 聚集 函数 列表 AL 用 于 关系 及 ， 以 获得 在 聚集 列表 上 定义 的 一 个 关系 。AL 包含 
一 个 或 多 个 (( 聚 集 函 数 ), (属性 )) 对 。 


主要 的 聚集 函数 有 : 

© COUNT: 返回 相关 联 属性 值 的 个 数 。 
e SUM: 返回 相关 联 属性 值 的 总 和 。 
e AVG: 返回 相关 联 属性 值 的 平均 值 。 
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e MIN: 返回 相关 联 属性 值 的 最 小 值 。 
e MAX: 返回 相关 联 属性 值 的 最 大 值 。 


| 例 5.12 « 聚集 运算 
(a) 每 月 租金 超过 350 英镑 的 房产 有 多 少 处 ? 
我 们 使 用 聚集 函数 COUNT 来 产生 如 图 5-13a 所 示 的 新 关系 R: 
Pa(myCount) I count propertyNo (Frene > 350 (PropertyForRent)) 
(b) 找 出 员工 薪水 的 最 小 值 、 最 大 值 和 平均 值 。 
我 们 可 以 使 用 聚集 函数 MIN, MAX 和 AVERAGE 来 产生 如 图 5-13b 所 示 的 新 关系 R: 


pr(myMin, myMax, myAverage) I Mn salary, MAX salary, AVERAGE salary (Staff) « 
a) 找到 租金 超过 b) 找到 员工 薪水 的 最 小 值 、 
£350 的 房产 数 “最 大 值 和 平均 值 


图 5-13 聚集 运算 的 结果 
分 组 运算 


caASAL(R) | 根据 分 组 属性 GA 对 关系 及 的 元 组 进行 分 组 ， 然 后 使 用 聚集 函数 列表 AL 得 到 新 
关系 。AL 包含 一 个 或 多 个 ( 《聚集 函数 ),〈 属 性 )) 对 。 结 果 关 系 包 含 分 组 属性 GA， 以 及 
每 个 聚集 函数 的 结果 。 


分 组 运算 的 一 般 形式 如 下 : 

al Ahea a, 3 <Apap>, <Agag> ++ +s <A,a,> (R) 
其 中 R 是 任意 关系 ，au az …, an 是 R 的 属性 ， 依 赖 这 些 属 性 来 分 组 ，a, a, … , az 是 R 的 其 
WETE, Ap Ag, …, A 是 聚集 函数 。R 的 元 组 被 分 割 成 具有 下 列 性 质 的 组 : 

e 同一 组 中 的 所 有 元 组 在 属性 a, a,,…, a, 上 具有 相同 的 值 。 

e 不 同 组 中 的 元 组 在 属性 ai, a, …, a, 上 具有 不 同 的 值 。 

我 们 在 下 面 例子 中 说 明 如 何 使 用 分 组 操作 。 
| 例 5.13 « 分 组 运算 

找 出 在 每 个 分 公司 工作 的 员工 人 数 和 他 们 的 薪水 总 和 。 

我 们 首先 需要 根据 分 公司 编号 branchNo 对 元 组 进行 分 
组 ， 然 后 使 用 聚集 函数 COUNT 和 SUM 来 产生 需要 的 关系 。 
关系 代数 表达 式 如 下 : 


pr(branchNo, myCount, mySum) pranchNo I COUNT staffNo, SUM salary (Staff) 图 5-14 找 出 在 每 个 分 公司 工作 
结果 关系 如 图 5-14 所 示 。 的 员工 人 数 和 他 们 薪水 总 和 的 分 


5.1.6 关系 代数 运算 小 结 组 运算 结果 
表 5-1 对 关系 代数 运算 进行 了 总 结 
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表 5-1 关系 代数 运算 
a g 表示 方法 功 能 


选择 产生 一 个 新 关系 ， 其 中 只 包含 R 中 满足 特定 条 件 (谓词 ) 的 元 组 


产生 一 个 新 关系 ， 它 是 由 指定 属性 组 成 的 R 的 一 个 垂直 子 集 ， 并且 


删除 了 重复 元 组 
并 RUS 产生 一 个 包含 R、S 中 所 有 不 同 元 组 的 新 关系 。R 和 S 必须 具有 并 相 
P 
容 性 
MAk 产生 一 个 新 关系 ， 它 由 属于 R 但 不 属于 S 的 元 组 构成 。R 和 S 必须 
具有 并 相 容 性 
a wae 产生 一 个 新 关系 ， 它 由 既 属于 RR 又 属于 S 的 元 组 构成 。R 和 S 必须 
具备 并 相 容 性 
产生 一 个 新 关系 ， 它 是 关系 R 中 每 个 元 组 与 关系 S$ 中 每 个 元 组 的 并 
笛 卡 儿 乘 积 RXS 联 的 结果 
产生 一 个 新 关系 ， 它 包含 了 R 和 SS 的 笛 卡 儿 乘 积 中 所 有 满足 谓词 F 
6 连接 a 
的 元 组 
等 接 产生 一 个 新 关系 ， 它 包含 了 R 和 S 的 笛 卡 儿 乘 积 中 所 有 满足 (只 存 
% 在 相等 比较 的 ) 谓词 F 的 元 组 
自然 连接 关系 R 和 S 在 所 有 公共 属性 x 上 的 相等 连接 。 但 得 到 的 结果 中 ， 每 
; 个 公共 属性 只 保留 一 次 ， 其 余 删 除 
(ey Wee ine (Ze) 外 连接 是 这 样 一 种 连接 ， 它 将 R 中 那些 在 S 中 无 法 找到 匹配 的 公 
共 属 性 的 元 组 也 保留 在 结果 关系 中 ， 只 是 对 应 S 关系 的 属性 值 均 取 空 
半 连 接 产生 一 个 新 关系 ， 包 含 R 中 的 这 样 一 些 元 组 ， 它 们 参与 了 R 与 S 满 
足 谓词 上 的 连接 
除法 产生 一 个 属性 集合 C 上 的 关系 ， 该 关系 的 元 组 与 S 中 每 个 元 组 组 合 都 
能 在 R 中 找到 匹配 元 组 。 其 中 ,C 是 属于 R 但 不 属于 S 的 属性 的 集合 
聚集 S a(R) 对 关系 R 应 用 聚集 函数 列表 AL 来 在 聚集 列表 上 定义 一 个 关系 。AL 
j: 包含 一 个 或 多 个 (( RRM), 《属性 》) 对 。 


根据 分 组 属性 GA 对 关系 R 的 元 组 进行 分 组 ， 然 后 使 用 聚集 函数 列 
分 组 GA 马 AL(R) R AL 定义 新 的 关系 。AL 包含 一 个 或 更 多 ( 《上 聚集 函数 ), 《属性 )) 对 。 
结果 关系 包含 分 组 属性 GA 和 每 个 聚集 函数 的 结果 。 


5.2 关系 ; 


在 关系 代数 表达 式 中 ， 一 般 都 显 式 指 定 一 个 计 值 顺序 ， 它 隐 含 着 执行 查询 的 策略 。 在 关 
系 演算 中 ， 不 描述 查询 执行 策略 ， 即 关系 演算 表达 查询 只 说 明 要 什么 ,不 说 明 如 何 得 到 它 。 

关系 演算 跟 数 学 中 的 微 积分 无 关 ， 而 是 根据 符号 逻辑 中 的 一 个 分 支 一 一 谓词 演算 命名 
的 。 在 数据 库 中 ， 它 有 两 种 形式 : H Codd ( 1972a) 首先 提出 的 元 组 关系 演算 ， 由 Lacroix 
和 Pirotte (1977 ) 提出 的 域 关 系 演算 。 

在 一 阶 逻 辑 或 谓词 演算 中 ,谓词 是 一 个 带 参 数 的 真 值 阴 数 。 如 果 把 参数 值 带 入 ， 这 个 卫 
数 就 会 变 成 一 个 表达 式 ， 称 为 命题 ， 它 非 真 即 假 。 例 如 ,， “John White 是 一 名 员工 Al “John 
White 的 收入 高 于 Ann Beech” 这 两 个 语句 都 是 命题 ， 因 此 可 以 确定 它们 是 真 还 是 假 。 在 第 
一 个 例子 里 ， 因 数 为 “是 一 名 员工 ”， 带 有 一 个 参数 (John White); 在 第 二 个 例子 中 ， 函 数 
为 “收入 高 于 "” ， 它 有 两 个 参数 (John White 和 Ann Beech), 

如 果 某 个 谓词 包含 一 个 变量 ， 比 如 ,“x 是 一 名 员工 ”， 那 么 就 一 定 有 一 个 与 x 相关 联 的 


i 
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论 域 (range)。 当 我 们 把 该 论 域 中 的 某 些 值 赋 给 x 时 ， 命题 可 能 为 真 ; 而 对 于 另 一 些 值 ， 命 
题 则 可 能 为 假 。 例 如 ， 论 域 是 所 有 人 的 集合 ， 帮 将 John White 带 入 x， 则 命题 “ John White 
是 一 名 员工 ”为 真 。 帮 将 某 个 非 员 工 的 人 名 代入 ， 则 命题 为 假 。 

假设 P 是 一 个 谓词 ， 那 么 所 有 使 P 为 真 的 x 的 集合 就 可 以 表示 成 : 

{x | P(x)} 

可 以 用 逻辑 连接 词 人 A (与 )、V (GO). 一 CE) 连接 谓词 形成 复合 谓词 。 


5.2.1 元 组 关系 演算 

在 元 组 关系 演算 中 ， 我们 感 兴趣 的 是 找 出 所 有 使 谓词 为 真 的 元 组 。 这 种 演算 是 基于 元 组 
变量 的 。 元 组 变量 是 “定义 于 ” 某 个 命名 关系 上 的 变量 ， 即 该 变量 的 论 域 仅 限于 这 个 关系 中 
的 元 组 (“ 论 域 ” 这 个 词 在 这 里 不 是 指数 学 中 的 值 域 ， 而 是 定义 域 )。 例 如 ， 指 定 元 组 变量 S 
的 范围 为 关系 Staff, WAM: 

Staff(S) 

要 表示 “和 找 出 所 有 使 F(S) 为 真 的 元 组 S 构成 的 集合 ”这 样 一 个 查询 ， 可 以 表示 为 : 

{S |F(s)} . 

F 称 为 公式 (在 数理 逻辑 中 称 为 合式 公式 或 wff)。 例 如 ， 要 表示 查询 “ 列 出 收入 高 于 
10 000 英镑 的 所 有 员工 的 staffNo、fName、IName、position、sex、DOB、salary  branchNo”, 
可 以 写成 : 

{S | Staff(S) A S.salary > 10000} 
S.salary 代表 元 组 变量 S 在 salary 属性 上 的 取 值 。 如 果 想 获取 某 个 特定 的 属性 ， 如 salary, 
就 可 以 写成 : 


{S.salary | Staff(S) A S.salary > 10000} 


存在 量词 与 全 程 量词 

可 以 在 公式 中 使 用 两 个 量词 来 说 明 谓 词 将 作用 在 多 少 个 实例 上 。 存 在 量词 “3”( 表 “ 存 
E”) 在 公式 中 说 明 至 少 有 一 个 实例 使 谓词 为 真 ， 例 如 : 

Staff(S) 和 A (SB) (Branch(B) A (B.branchNo = S.branchNo) A B.city = ‘London’) 
表示 “在 Branch 中 存在 一 个 元 组 ， 它 在 branchNo 上 的 取 值 与 Staff 的 元 组 S 在 branchNo 上 
的 取 值 相同 而 且 对 应 的 分 公司 位 于 伦敦 ”。 全 称 量词 “Vv" (表示 “对 于 所 有 的 ”) 在 公式 中 说 
明 每 个 实例 都 必须 满足 这 个 谓词 ， 例 如 : 

(VB) (B.city # ‘Paris’) 
表示 “ Branch 中 的 所 有 分 公司 都 不 在 巴黎 ”。 可 以 将 德 * 摩根 定律 推广 到 存在 量词 和 全 称 量 
词 。 例 如 : 

(3X)(F(X)) = ~ (VX)(~(F(X))) 

(VX)(F(X)) = ~(3X)(~(F(X))) 

(AX)(F(X) A F(X) = ~(VX)(~(F(X)) v ~(F>(X))) 

(YX)(FI(X) A F(X)) = ~(3X)(~(F(X)) v ~(F2(X))) 


利用 这 些 等 价 规则 ， 可 以 把 前 面 的 公式 写成 : 
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~(4B) (B.city = ‘Paris’) 


表示 “巴黎 没有 分 公司 ”。 


查询 : 


ZY 或 “3 ”约束 的 元 组 变量 称 为 约束 变量 ， 反 之 ， 其 他 的 元 组 变量 则 称 为 自由 变 
B.city = ‘London’)} 
表达 式 和 公式 


量 。 在 关系 演算 表达 式 中 ， 只 有 那些 在 竖 线 〈|) 左边 出 现 的 变量 是 自由 变量 。 例 如 下 面 的 
{S.fName, S.IName | Staff(S) 和 (3B) (Branch(B) A (B.branchNo = S.branchNo) A 


S 是 唯一 的 自由 变量 ， 接 着 被 约束 遍 取 Staff 中 每 一 元 组 。 


正如 并 不 是 任意 排列 的 英文 字母 序列 都 可 以 构成 一 个 结构 正确 的 语句 一 样 ， 也 不 是 每 一 
个 演算 公式 序列 都 可 以 被 接受 。 公 式 序 列 必须 是 无 歧义 且 有 意义 的 。 元 组 关系 演算 中 的 一 个 
表达 式 必须 具有 下 面 所 示 的 一 般 形式 : 

{S1. a1, $2. a2, ***, Sn- an| F(S1, S2, ***, Sm)} 
其 中 ， Si, S2, von 


m=—n 


Sn, t, Sm 代表 元 组 变量 ， 每 个 a; 是 元 组 变量 S 的 论 域 关 系 的 一 个 属性 ，F 
为 公式 。 一 个 (合式 ) 公式 包括 一 个 或 多 个 原子 公式 ， 原 子 公 式 可 以 有 下 面 几 种 形式 : 
e R(S;))， 其 中 S$; 是 一 个 元 组 变量 ，R 是 一 个 关系 。 


是 元 组 变量 S 的 论 域 关 系 的 一 个 属性 ，9 ERREZA (<, <, >, 
中 的 一 个 。 属 性 a 和 az 的 值 必须 可 进行 6 比较 。 


之 


oa 


© Sial 9 San, HF S AS; 为 元 组 变量 ，al 是 元 组 变量 ;的 论 域 关 系 的 一 个 属性 ，a， 


@ Si.al 0 C, 其 中 Si 是 一 个 元 组 变量 ， al 是 元 组 变量 Si 的 论 域 关系 的 一 个 属性 ， C 是 局 
性 a, 对 应 域内 的 一 个 常数 ，6 是 一 个 比较 运算 符 。 

可 以 根据 下 面 的 规则 ， 递 归 地 构造 出 公式 : 

© 原子 公式 是 公式 。 

e 如 果 Fl 和 F, 是 公式 ， 则 它们 的 合 取 Fi 八 F,、 析 取 F1VF,， 以 及 取 非 一 Fi 也 是 公式 。 
| 例 5.14 入 元 组 关系 演算 


e 如 果 下 是 带 自 由 变量 XX 的 公式 ， 则 (3X)(F) 和 (YX)(F) 也 是 公式 。 
(a) 列 出 收入 高 于 25 000 英镑 的 所 有 经 理 的 姓名 。 


{S.fName, S.IName | Staff(S) A S.position = ‘Manager’ a S.salary > 25000} 
(b) 列 出 管理 格拉 斯 哥 待 租 房产 的 员工 。 
{S | Staff(S) 和 (AP) (PropertyForRent(P) A (P.staffNo = S.staffNo) A P.city = Glasgow )} 


在 PropertyForRent 关系 的 staffNo 属性 中 ， 存 储 了 对 房产 进行 管理 的 员工 的 编号 。 可 以 


这 其 中 其 实 隐 含 着 运算 顺序 。 


将 这 个 查询 重新 表示 成 :“ 对 于 欲 列 出 详情 的 每 位 员工 ， 在 关系 PropertyForRent 中 存在 一 个 
对 应 于 它 的 元 组 ， 并 且 该 元 组 在 属性 city 上 的 取 值 为 格拉 斯 哥 。 
注意 ， 在 表示 该 查询 的 公式 中 ,没有 给 出 此 查询 的 实现 策略 一 一 将 由 DBMS 来 决定 满 


足 这 一 请 求 所 需 的 运算 ， 以 及 这 些 运 算 的 顺序 。 另 一 方面 ， 与 之 等 价 的 关系 代数 公式 为 : 从 
PropertyForRent 关系 中 选择 city 取 值 为 格拉 斯 哥 的 元 组 ， 并 将 它们 与 Staff 关系 连接 起 来 。 
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(c) 列 出 当前 未 管理 任何 房产 的 员工 的 名 单 。 

{S.fName, SJName | Staff(S) 和 (~(3P) (PropertyForRent(P) 和 (S.staffNo = P.staffNo)))} 
对 上 面 所 给 出 的 量词 使 用 通用 的 转换 规则 ， 可 以 将 它们 转换 为 : 
{S.fName, S.IName | Staff(S)  ((VP) (~PropertyForRent(P) v ~(S.staffNo = P.staffNo)))} 
(d) 列 出 查看 过 格拉 斯 哥 待 租房 产 的 客户 名 单 。 


{C.fName, C.IName | Client(C) a ((3V) (GP) (Viewing(V) A PropertyForRent(P) A 
(C.clientNo = V.clientNo) A (V.propertyNo = P.propertyNo) 和 P.city = ‘Glasgow’))} 


为 了 实现 这 一 查询 ， 可 以 把 “查看 过 格拉 斯 哥 的 待 租房 产 的 客户 ”理解 成 “ 找 出 这 样 的 
客户 ， 他 的 姓名 存在 于 格拉 斯 哥 的 某 条 房产 查看 记录 中 ”。 

(e) 列 出 或 有 分 公司 或 有 待 租房 产 的 城市 。 

{T.city | GB) (Branch(B) ^ (B.city = T.city)) v GP) (PropertyForRent(P) ^ (P.city = T.city))} 

试 比较 例 5.3 中 所 给 出 的 与 之 等 价 的 关系 代数 表达 式 。 

(E) 列 出 有 分 公司 但 没有 待 租房 产 的 城市 。 

{B.city | Branch(B) A (~(3P) (PropertyForRent(P) A (B.city = P.city)))} 

试 比较 例 5.4 中 所 给 出 的 与 之 等 价 的 关系 代数 表达 式 。 

(g) 列 出 既 有 分 公司 又 至 少 有 一 处 待 租房 产 的 城市 。 

{B.city | Branch(B) 和 (GP) (PropertyForRent(P) ^ (B.city = P.city)))} 


试 比较 例 5.5 中 所 给 出 的 与 之 等 价 的 关系 代数 表达 式 。 « 


表达 式 的 安全 性 
在 本 节 结 束 之 前 ， 还 需要 说 明 的 是 ,演算 表 达 式 可 以 生成 一 个 无 穷 集 。 例 如 : 
{S | ~ Staff(S)} 


表示 不 在 Staff 关系 中 的 所 有 元 组 。 将 这 样 的 表达 式 称 为 不 安全 表达 式 。 为 了 避免 这 种 情 
况 的 出 现 ， 必 须 添 加 一 个 约束 ,在 结果 中 出 现 的 所 有 值 必 须 在 表达 式 E 的 域内 ， 表 示 成 
dom(E)。 换 句 话说 ，E 的 域 包 括 所 有 显 式 出 现在 E 中 的 值 和 所 有 在 E 中 出 现 的 关系 中 的 值 。 
上 例 中 ， 表 达 式 的 域 就 是 所 有 出 现在 关系 Staff 中 的 值 。 

当 结 果 中 出 现 的 所 有 值 都 在 表达 式 的 域内 时 ， 这 个 表达 式 就 是 安全 的 。 上 面 的 表达 式 是 
不 安全 的 ,原因 就 在 于 它 包 括 了 Sta 作 关系 之 外 的 元 组 〈 因 此 超出 了 表达 式 的 域 ) 本 节 中 所 
给 出 的 其 他 元 组 演算 表达 式 都 是 安全 的 。 一 些 人 用 独立 的 RANGE 语句 来 定义 变量 的 论 域 ， 
以 避免 这 个 问题 的 出 现 。 感 兴趣 的 读者 可 以 参考 Date (2000 ) 。 


5.2.2 域 关 系 演算 


在 元 组 关系 演算 中 ,使 用 了 定义 在 关系 上 的 元 组 变量 。 在 域 关 系 演算 中 ， 同 样 也 要 用 到 
变量 ,但 它 的 论 域 不 再 是 关系 中 的 元 组 ， 而 是 属性 的 域 。 域 关系 演算 中 的 表达 式 具 有 下 面 的 
一 般 形式 : 

{di, do, *…, dn | F(di, do, +*+, dn)} -~ men 
HP, di, ds,…, dn, …, dn 代表 域 变 量 ，F(di, do, …; dn) 代表 由 某 些 原子 公式 组 成 的 公式 ， 
原子 公式 可 有 下 面 几 种 形式 : 
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e R(di, do, …, da), EP R AERA n 的 关系 ，d; 为 域 变 量 。 

e di0 d;， 其 中 d; 和 d; 代 表 域 变量 , 9 是 比较 运算 符 ( 达 , <, >, 2, =, A) 中 的 
一 个 。d; 和 d 对 应 域 的 值 必须 可 进行 0 比较 。 

ed Oc, Hip d 是 域 变量 ,c 是 d 对 应 域 中 的 一 个 常数 ，6 是 某 个 比较 运算 符 。 

可 以 根据 下 面 的 规则 ， 用 原子 公式 递归 地 构造 出 公式 : 

e 原子 公式 是 公式 。 

e WRF, 和 了: 是 公式 ， 则 它们 的 合 取 F,VEFz、 析 取 FyAF;， 以 及 取 非 二 F' 也 是 公式 。 

o WR F 是 带 上 自由 变量 X 的 公式 ， 则 (3X)(F) Al (VX)(F) 也 是 公式 。 


| 例 5.15 >> 域 关 系 演 算 
在 下 面 的 例子 中 ， 采 用 如 下 简化 形式 : 
H (adi, do, ++, da) RÆ (Adi), (3d>),…, ( 3da) 
(a) 列 出 收入 高 于 25 000 英镑 的 所 有 经 理 的 姓名 。 


{fN, IN | (3sN, posn, sex, DOB, sal, bN) (Staff(sN, fN, IN, posn, sex, DOB, sal, bN) A 
posn = ‘Manager’ ^ sal > 25000)} 


如 果 把 这 个 查询 跟 例 5.14(a) 中 等 价 的 元 组 关系 演算 查询 进行 比较 ， 可 以 看 到 每 个 属性 
被 赋予 了 一 个 (变量) 名。 条件 Staff (SN, fN, =, DN) 保证 了 这 些 域 变 量 对 应 于 同一 元 组 
的 不 同属 性 。 因 此 ， 可 以 用 公式 posn=‘ Manager ”来 代替 Staff.position= * Manager’. i& 
要 注意 存在 量词 使 用 上 的 区 别 。 在 元 组 关系 演算 中 ， 如 果 给 某 个 元 组 变量 posn 加 上 量词 
3posn， 就 要 通过 Staff ( posn) 把 这 个 变量 跟 Sta 任 关系 绑 定 在 一 起 ， 而 在 域 关系 演算 中 ， 
posn 代表 一 个 域 值 ， 它 不 受 约束 。 只 有 当 它 出 现在 子 公 式 Staff (sN, fN, IN, posn, sex, 
DOB, sal, bN) 中 时 ， 它 的 定义 域 才 会 限制 在 Staff 关系 的 position 属性 的 取 值 集合 中 。 
为 了 简单 起 见 ， 在 本 节 后 面 所 给 出 的 例子 中 ， 只 对 那些 真正 出 现在 条 件 中 的 域 变量 进行 
量化 (在 本 例 中 ， 就 是 posn 和 sal). 
(b) 列 出 管理 格拉 斯 哥 待 租房 产 的 员工 。 
{sN, fN, IN, posn, sex, DOB, sal, bN | (3sN1, cty) (Staff(sN, fN, IN, posn, sex, DOB, sal, DN) A 
PropertyForRent(pN, st, cty, pc, typ, rms, rnt, ON, SN1, DN1) A (SN = sN1) A 
cty = ‘Glasgow’)} 
该 查询 还 可 写成 : 
{sN, fN, IN, posn, sex, DOB, sal, bN | (Staff(sN, fN, IN, posn, sex, DOB, sal, DN) A 
PropertyForRent(pN, st, ‘Glasgow’, pc, typ, rms, mt, oN, sN, DN1))} 
如 果 用 此 形式 ，PropertyForRent 中 的 域 变量 cty 就 被 常量 “Glasgow” 所 代替 ， 代 表 员 
工 编号 的 域 变量 SN 则 在 Staff 和 PropertyForRent 条 件 中 重复 出 现 。 
(c) 列 出 当前 没有 管理 任何 房产 的 员工 的 姓名 。 
{fN, IN | GSN) (Staff(sN, fN, IN, posn, sex, DOB, sal, bN) A 
(~(3sN1) (PropertyForRent(pN, st, cty, pc, typ, rms, rnt, ON, SN1, DN1) 入 (SN = sN1))))} 


(d) 列 出 查看 过 格拉 斯 哥 待 租 房产 的 客户 的 姓名 。 


{fN, IN | (3cN, cN1, pN, pN1, cty) (Client(cN, fN, IN, tel, pT, mR, eM) 和 
Viewing(cN1, pN1, dt, cmt) A PropertyForRent(pN, st, cty, pc, typ, rms, rnt, oN, SN, DN) A 
(CN = cN1) a (pN = pN1) A cty = ‘Glasgow’)} 


(e) 列 出 或 有 分 公司 或 有 待 租房 产 的 城市 。 
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{cty | (Branch(bN, st, cty, pc) v 
PropertyForRent(pN, st1, cty, pc1, typ, rms, rnt, oN, sN, DN1))} 
(£) 列 出 有 分 公司 但 没有 待 租 房产 的 城市 。 


{cty | (Branch(bN, st, cty, pc) ^ 
(~Gcty1)(PropertyForRent(pN, st1, cty1, pc1, typ, rms, rnt, ON, SN, bN1) A (cty = cty1))))} 


(g) 列 出 既 有 分 公司 又 至 少 有 一 处 待 租房 产 的 城市 。 


{cty | (Branch(bN, st, cty, pc) 入 
(Acty1) (PropertyForRent(pN, st1, cty1, pc1, typ, rms, rnt, oN, sN, bN1) A (cty = ctyl)))} 《所 
这 些 查 询 都 是 安全 的 。 当 把 域 关 系 演算 限制 为 安全 表达 式 时 ， 它 就 等 价 于 安全 的 元 组 关 
系 演算 ， 而 这 种 元 组 关系 演算 又 等 价 于 关系 代数 。 这 就 意味 着 ,每 个 关系 代数 表达 式 都 存在 
一 个 与 之 等 价 的 关系 演算 表达 式 ， 反 过 来 ， 每 个 元 组 或 者 域 关 系 演算 表达 式 都 存在 一 个 与 之 
等 价 的 关系 代数 表达 式 。 


5.3 “其 他 语言 

虽然 关系 演算 难于 理解 与 使 用 ,但 其 非 过程 性 令 人 非常 满意 ， 因 此 人 们 开始 寻求 更 易于 
使 用 的 非 过 程 化 技术 。 这 导致 了 男 外 两 类 关系 语言 的 出 现 : 面向 转换 的 语言 和 图 形 化 语言 。 

面向 转换 的 语言 ( transform-oriented language) 是 一 种 非 过 程 语言 ， 它 利用 关系 将 输入 
数据 转换 成 所 期 望 的 输出 。 这 种 语言 提供 了 一 种 易于 使 用 的 结构 ， 可 以 很 容易 地 根据 已 知 
的 内 容 表 述 出 所 期 望 的 结果 。SQUARE (Boyce etal., 1975), SEQUEL (Chamberlin et al., 
1976 ) 以 及 SEQUEL 的 后 继 产品 SQL 语言 都 是 面向 转换 的 语言 。 第 6 一 9 章 将 对 SQL 进 
行 讨 论 。 

图 形 化 语言 (graphical language) 给 用 户 提供 了 关系 结构 的 一 种 图 解说 明 。 用 户 在 一 个 
实例 中 填 人 想 要 的 输出 ， 系 统 则 以 这 种 格式 返回 所 需 的 数据 。QBE (举例 查询 ) 就 是 图 形 化 
语言 (Zloof，1977 ) 的 一 个 范例 。 附 录 M 中 将 详细 讨论 QBE 的 功能 。 

还 有 一 类 称 为 第 四 代 语 言 (4GL)， 它 允许 用 户 使 用 一 个 受 限 的 命令 集 来 创建 完整 的 用 
户 应 用 ， 这 个 命令 集 对 用 户 十 分 友好 ,通常 为 菜单 驱动 的 环境 (参见 2.2 节 )。 某 些 系统 还 能 
接受 自然 语言 ， 比 如 受 限 的 英语 。 这 类 语言 常 称 为 第 五 代 语 言 (SGL)， 它 们 的 发 展 仍 处 于 
起 步 阶段 。 


本 章 小 结 

e 关系 代数 是 一 种 (高 级 ) 过 程 性 语言 ， 它 可 以 告知 DBMS 如 何 根据 数据 库 中 的 一 个 或 多 个 关系 创 
建新 关系 。 关 系 演算 则 是 一 种 非 过 程 性 语言 ， 它 用 公式 说 明 根 据 一 个 或 多 个 数据 库 关系 定义 的 新 关 
系 。 然 而 ， 关 系 代数 与 关系 演算 是 等 价 的 ， 即 每 个 关系 代数 表达 式 都 可 以 找到 一 个 与 之 等 价 的 关系 
演算 表达 式 (反之 亦 然 )。 

© 关系 演算 用 来 衡量 关系 语言 的 选择 能 力 。 如 果 一 种 语言 能 生成 所 有 由 关系 演算 导出 的 关系 ， 就 称 它 

具有 关系 完备 性 。 大 多 数 关 系 查 询 语言 都 具有 关系 完备 性 ， 而 且 它 们 比 关系 代数 或 关系 演算 更 具 表 

达能 力 ， 因 为 它们 一 般 附 加 了 计数 、 求 和 以 及 排序 等 运算 。 

关系 代数 的 五 个 基本 运算 为 选择 、 投 影 、 笛 卡 儿 乘积 、 并 及 集合 差 ， 借 助 它们 能 实现 人 们 感 兴趣 的 大 

多 数 数据 检索 运算 。 此 外 ， 还 有 连接 、 交 以 及 除法 等 运算 ， 它 们 都 可 以 用 五 个 基本 运算 表示 出 来 。 

e 关系 演算 是 一 种 非 过程 性 语言 ， 它 使 用 了 谓词 。 有 两 种 形式 的 关系 演算 : 元 组 关系 演算 和 域 关 系 演算 。 
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e 元 组 关系 演算 感 兴 趣 的 是 找 出 所 有 使 谓词 为 真 的 元 组 。 元 组 变量 是 “定义 于 ” 某 个 命名 关系 上 的 变 
量 ， 即 该 变量 的 论 域 仅 限于 这 个 关系 的 所 有 元 组 。 

在 域 关 系 演算 中 ， 域 变量 的 取 值 范围 是 属性 的 域 ， 而 不 是 关系 中 的 元 组 。 

© 关系 代数 在 逻辑 上 等 价 于 关系 演算 的 一 个 安全 子 集 (反之 亦 然 )。 

关系 数据 运算 语言 一 般 分 为 过 程 和 非 过 程 语言 、 面 向 转换 的 语言 、 图 形 化 语言 、 第 四 代 语 言 和 第 五 
代 语 言 。 


思考 题 


5.1 过 程 性 语言 跟 非 过 程 性 语言 有 什么 区 别 ? 关系 代数 和 关系 演算 分 别 属于 哪 一 类 ? 
5.2 解释 下 列 术语 : 
(a) 关系 完备 性 
(b) 关系 运算 的 闭 包 
5.3 给 出 五 个 基本 代数 运算 的 定义 。 根 据 这 五 个 基本 运算 定义 连接 、 交 以 及 除法 运算 。 
5.4 ”讨论 五 种 连接 运算 ， 即 ? 连接 、 等 接 、 自 然 连 接 、 外 连接 以 及 半 连 接 之 间 的 差别 ， 并 举例 说 明 。 
5.5 ”比较 元 组 关系 演算 和 域 关系 演算 之 间 的 区 别 与 联系 ,重点 讨论 它们 之 间 的 区 别 。 
5.6 分 别 给 出 元 组 关系 演算 和 域 关系 演算 的 (合式 ) 公式 结构 的 定义 。 
57 关系 演算 表达 式 在 何 种 情况 下 是 不 安全 的 ? 请 举例 说 明 。 如 何 确保 关系 演算 表达 式 的 安全 性 ? 


习题 
下 面 的 习题 用 到 了 在 第 4 章 习 题 中 定义 的 Hotel 数据 库 模式 。 
5.8 ”描述 由 下 列 关 系 代数 运算 生成 的 关系 : 


(a) Tomo( price > so(Room)) 
(U) Grote hoteiNo = Room haaNo(Hotel X Room) 


(c) TT otetwame(Hotel ?4HoelhaeiNe = Room.hotèinol T, price > 50(Room))) 
(d) Guest >4 (adatero = ++Jan-2007(Booking)) 


(e) Hotel > Hoteihoteino = RoomhoteiNo( price > so(Room)) 
(f) Ha hotelNo(BOOking 4 Booung guestNo = GuestguestNo Guest) + JIeno(auv = ‘London(Hotel)) 


5.9” 写 出 与 习题 5.8 中 的 关系 代数 查询 等 价 的 元 组 关系 演算 和 域 关 系 演算 。 


5.10 ”描述 由 下 列 元 组 关系 演算 表达 式 生 成 的 关系 : 


(a) {H.hotelName | Hotel(H) A H.city = ‘London’} 

(b) {H.hotelName | Hotel(H) 和 (AR) (Room(R) A H.hotelNo = R.hotelNo 入 R.price > 50)} 

(c) {H.hotelName | Hotel(H) A (4B) (AG) (Booking(B) ^ Guest(G) A H.hotelNo = B.hotelNo A 
B.guestNo = G.guestNo ^ G.guestName = ‘John Smith’)} 

(d) {H.hotelName, G.guestName, B1.dateFrom, B2.dateFrom | Hotel(H) 和 A Guest(G) 和 Booking(B1) 入 
Booking(B2) ^ H.hotelNo = B1.hotelNo 和 A G.guestNo = B1.guestNo A B2.hotelNo = B1.hotelNo 入 
B2.guestNo = B1.guestNo ^ B2.dateFrom A B1.dateFrom} 


5.11 写 出 与 习题 5.10 中 的 元 组 关系 演算 表达 式 等 价 的 域 关 系 演算 和 关系 代数 表达 式 。 
5.12 ”给 出 下 列 查询 所 对 应 的 关系 代数 、 元 组 关系 演算 和 域 关 系 演算 表达 式 : 

(a) 列 出 所 有 的 酒店 。 

(b) 列 出 所 有 价格 低 于 每 晚 20 英镑 的 单 人 间 。 

(c) 列 出 所 有 客人 的 姓名 和 所 属 城市 。 

(d) 列 出 格 罗 夫 纳 酒店 中 所 有 房间 的 价格 和 类 型 。 

(e) 列 出 当前 住 在 格 罗 夫 纳 酒店 里 的 所 有 客人 。 


5.13 


5.14 
5.15 
5.16 
5.17 
5.18 
5.19 


5.20 
5.21 
5.22 
5.23 
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(f) 列 出 格 罗 夫 纳 酒店 中 所 有 房间 的 详细 资料 。 如 果 房 间 已 经 被 占用 ， 还 应 该 包括 租用 此 房间 
的 客人 的 姓名 。 

(g) 列 出 住 在 格 罗 夫 纳 酒 店 的 所 有 客人 的 详细 资料 (guestNo、guestName 和 guestAddress)。 

使 用 关系 代数 创建 一 个 包含 格 罗 夫 纳 酒店 中 所 有 房间 的 视图 ， 并 隐藏 价格 信息 。 说 明 这 个 视图 

的 优点 。 

下 表 是 存在 某 RDBMS 中 的 数据 库 的 一 部 分 : 


Employee (empNo, fName, IName, address, DOB, sex, position, deptNo) 
Department (deptNo, deptName, mgrEmpNo) 

Project (projNo, projName, deptNo) 

WorksOn (empNo, projNo, dateWorked, hoursWorked) 


Hit}, Employee 包含 雇员 的 详情 ，empNo 是 主 关 键 字 。 

Department 包含 部 门 的 详情 ，deptNo 是 主 关键 字 。mgrEmpNo 指出 担任 该 部 门 经 理 的 雇员 。 每 
个 部 门 仅 一 位 经 理 。 

Project 包含 每 个 部 门 项 目的 详情 ，proNo 是 主 关键 字 (不 会 有 两 个 部 门 运作 同一 个 项 目 )。 
WorkOn 包含 在 每 个 项 目 中 雇员 参与 工作 的 时 长 情况 ，empNo/projNo/dateWorked 组 合 为 主 关 
键 字 。 

用 关系 代数 、 元 组 关系 演算 和 域 关 系 演算 表达 式 表 达 下 列 查询 。 

列 出 所 有 雇员 。 

列 出 所 有 女 雇 员 的 情况 。 

列 出 所 有 担任 经 理 的 雇员 的 名 字 和 地 址 。 

产生 所 有 为 IT 部 门 工作 的 雇员 的 名 字 和 地 址 表 。 

产生 参与 SCCS 项 目的 所 有 雇员 的 名 表 。 

产生 今年 内 退休 的 所 有 经 理 的 全 部 情况 表 ， 并 按 姓氏 字典 序 排列 。 

用 关系 代数 表达 式 表 达 下 列 查询 。 

找 出 有 多 少 雇员 由 James Adam 管理 。 

产生 每 位 雇员 工作 总 时 数 的 报表 。 

找 出 多 于 两 位 雇员 参与 工作 的 项 目 ， 列 出 项 目 编号 、 项 目 名 称 和 参与 该 项 目的 雇员 人 数 。 

列 出 雇员 数 多 于 10 人 的 那些 部 门 的 雇员 总 数 ， 为 结果 关系 各 列 赋予 合适 的 列 名 。 

下 表 是 某 RDBMS 管理 的 图 书馆 数据 库 的 一 部 分 : 


Book (ISBN, title, edition, year) 

BookCopy  (copyNo, ISBN, available) 

Borrower (borrowerNo, borrowerName, borrowerAddress) 
BookLoan (copyNo, dateOut, dateDue, borrowerNo) 


其 中 ,，Book 包含 图 书馆 馆藏 书目 的 情况 ，ISBN 是 主 关键 字 。 

BookCopy 包含 图 书馆 馆藏 书本 的 情况 ，copyNo 是 主 关键 字 ，ISBN 是 外 部 关键 字 ， 指 向 这 本 书 
对 应 的 书目 。 

Borrower 包含 能 在 图 书馆 借 书 的 读者 ，borrowerNo 是 主 关键 字 。 

BookLoan 包含 每 本 书 被 读者 借阅 的 情况 copyNo/dateOut 组 合成 主 关键 字 ，borrowerNo 是 外 部 
关键 字 ， 指 向 这 本 书 的 借阅 者 。 

用 关系 代数 、 元 组 关系 演算 和 域 关 系 演算 表达 式 表达 下 列 查询 。 


5.24 列 出 所 有 书目 。 
5.25 列 出 所 有 读者 的 情况 。 
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5.26 列 出 所 有 2012 年 出 版 的 书目 。 
5.27 列 出 所 有 书目 可 外 借 的 副本 。 
§.28 列 出 《指环 王 》 所 有 可 外 借 的 副本 。 
§.29 列 出 目前 正 借阅 《指环 王 》 的 读者 的 姓名 。 
5.30 列 出 有 预期 未 还 图 书 的 读者 的 姓名 。 

用 关系 代数 表达 式 表 达 下 列 查询 。 
5.31 ISBN 为 “0-321-52306-7” 的 书 有 多 少 本 ? 
5.32 ISBN 为 “0-321-52306-7” 的 书 还 有 多 少 本 可 外 借 ? 
5.33 ISBN 为 “0-321-52306-7” 的 书目 借 出 过 多 少 次 ? 
5.34 产生 由 Peter Bloomfield 借阅 的 图 书 的 书目 表 。 
5.35 ”对 馆藏 多 于 三 个 副本 的 书目 ， 列 出 借阅 过 它 的 读者 的 姓名 。 
5.36 产生 当前 借 有 图 书 逾 期 未 还 的 读者 的 情况 报表 。 
5.37 ”产生 每 个 书目 被 借阅 总 次 数 的 报表 。 
5.38 


分 析 当 前 你 所 使 用 的 RDBMS。 系 统 提供 了 哪 几 种 关系 语言 ? 对 于 所 提供 的 每 种 十 言 ， 找 出 与 
八 个 关系 代数 运算 (5.1 节 所 定义 的 ) 等 价 的 运算 。 
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| 本 章 目标 

本 章 我 们 主要 学 习 : 

o 结构 化 查询 语言 (SQL) 的 用 途 和 重要 性 

© SQL 的 发 展 史 
如 何 书写 SQL 命令 
如 何 用 SELECT 语句 检索 数据 库 中 数据 
如 何 构建 SQL 语句 
使 用 WHERE 语句 检索 满足 各 种 条 件 的 行 
使 用 ORDER BY 语句 将 查询 结果 排序 
使 用 SQL 的 聚集 函数 
使 用 GROUP BY 语句 将 数据 分 组 
使 用 子 查询 
表 的 连接 操作 

mw 进行 集合 操作 (UNION, INTERSECT, EXCEPT) 

e 如 何 用 INSERT, UPDATE ## DELETE 更 新 数据 库 


第 4 章 和 第 5 章 具体 描述 了 关系 数据 模型 和 关系 语言 。 关 系 模型 的 发 展 过 程 中 出 现 了 一 
种 称 为 结构 化 查询 语言 的 特殊 语言 ， 通 常 称 为 SQL。 在 过 去 的 几 年 里 ，SQL 已 成 为 标准 的 
关系 数据 库 语言 。1986 年 ， 美 国 国家 标准 化 组 织 (ANSI) 制定 了 SQL 标准 。1987 年 ， 国 际 
标准 化 组 织 接 受 了 这 一 标准 并 将 其 作为 国际 标准 (ISO，1987 )。 现 在 ， 从 PC 到 大 型 机 的 各 
种 硬件 平台 上 ， 运 行 着 的 一 百 多 种 数据 库 管理 系统 都 支持 SQL. 

鉴于 SQL 的 重要 性 ， 本 书 将 用 四 章 的 篇 幅 具 体 分 析 SQL 语言 ， 为 专业 和 非 专业 人 士 
(包括 程序 员 、 数 据 库 专家 和 经 理 们 ) 提供 一 种 易 理 解 的 说 明 ， 这 些 章节 的 内 容 主 要 集中 在 
ISO 定义 的 SQL 语言 上 。 然 而 ，SQL 标准 非常 复杂 ， 本 书 未 能 涵盖 它 的 所 有 细节 。 本 章 主 
要 讲述 SQL 的 数据 操作 语句 。 


6.1 节 对 SQL 进行 简介 并 阐述 该 数据 库 操 作 语 言 的 重要 性 。6.2 节 介 绍 本 书 表示 SQL 结 
构 时 所 用 表示 方法 。6.3 节 讨 论 如 何 用 SQL 语句 从 关系 中 检索 数据 ， 以 及 插入 、 更 新 和 删除 
数据 。 

进而 ， 本 书 将 在 第 7 章 分 析 SQL 语言 的 其 他 特性 ， 包 括 数 据 定 义 、 视 图 、 事 务 和 访 
问 控制 。 第 8 章 介 绍 更 高 级 的 语言 特性 ， 包 括 触发 器 和 存储 过 程 。 第 9 章 介 绍 SQL 规范 为 
了 支持 面向 对 象 数据 管理 功能 而 新 增 内 容 的 具体 细节 。 附 录 工 讨论 如 何 将 SQL KARA 
程 语言 ， 以 便 使 用 那些 目前 在 SQL 中 还 不 能 直接 用 的 结构 。 在 第 5 章 已 介绍 的 两 种 形式 语 
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言 ， 即 关系 代数 和 关系 演算 ， 为 学 习 SQL 标准 的 大 部 分 内 容 提 供 了 足够 的 基础 ， 在 学 习 
中 比较 两 章 相 对 应 的 部 分 是 很 有 意义 的 然而， 本 章 在 表述 上 与 第 $ 章 讲述 的 那些 语言 
本 无 关 ， 这 使 未 阅读 第 $ 章 的 读者 也 可 阅读 本 章 。 本 章 讲述 过 程 中 主要 是 以 图 4-3 所 示 的 
DreamHome 关系 数据 库 作 为 实例 。 


6.1 SQL 简介 
本 节 概 述 SQL 的 目标 、 发 展 简 史 以 及 对 数据 库 应 用 的 重要 性 。 


6.1.1 SQL 的 目标 


理想 情况 下 ， 数 据 库 语言 应 该 允许 用 户 : 

© 建立 数据 库 和 关系 结构 。 

© 完成 基本 数据 管理 任务 ， 诸 如 关系 中 数据 的 插入 、 修 改 和 删除 。 

e 完成 简单 或 复杂 的 查询 。 

数据 库 语 言 必须 功能 丰富 、 结 构 简 洁 、 易 学 易 用 。 另 外 ， 语 言 必 须 易 于 移植 ， 符 合 公认 
的 标准 ， 这 样 当 我 们 更 换 到 不 同 的 DBMS 时 ， 仍 可 以 使 用 相同 的 命令 和 语法 结构 。SQL if 
言 满足 这 些 要求 。 

SQL 语言 是 面向 转换 语言 的 例子 ， 它 将 输入 关系 转换 为 所 需 的 输出 关系 。 作 为 语言 ， 
国际 标准 化 组 织 (ISO) 发 布 的 SQL 标准 包括 两 个 主要 部 分 : 

o 数据 定义 语言 ( Data Definition Language, DDL) 用 于 定义 数据 库 结构 和 数据 的 访问 

控制 。 

e 数据 操作 语言 (Data Manipulation Language, DML) 用 于 检索 和 更 新 数据 。 

SQL:1999 出 现 以 前 ，SQL 仅 包 括 数 据 定 义 和 数 据 操 作 命令 ， 不 包括 控制 流 命令 ， 如 
IF... THEN...ELSE, GO TO 或 DO0..WHILE。 这 些 命令 的 实现 必须 用 编程 语言 或 任务 控制 语 
言 或 由 用 户 交 互 决定 。 由 于 缺乏 计算 完备 性 ， 仅 能 以 下 两 种 方式 使 用 SQL。 一 种 方法 是 在 
终端 交互 地 输入 SQL 语句 。 男 一 种 方法 是 将 SQL 语句 诡 入 过 程 化 语言 中 ， 这 种 方法 将 在 附 
录 工 详细 讨论 。 第 9 章 将 讨论 最 新 发 布 的 标准 SQL:2011。 

SQL 是 相对 易学 的 语言 : 

e 非 过 程 化 语言 : 用 户 只 需 描述 所 需 的 信息 ， 不 需 给 出 获取 该 信息 的 具体 过 程 。 换 名 

话说 ，SQL 不 需要 指定 数据 的 访问 方法 。 

© SQL 和 大 多 数 现代 语言 一 样 ， 是 无 格式 的 ， 这 意味 着 语句 的 每 一 部 分 不 必 固 定 在 屏 
幕 上 的 特定 位 置 。 
SQL 命令 由 标准 英语 单词 组 成 ， 如 CREATE TABLE, INSERT, SELECT 等 。 例 如 : 


- CREATE TABLE Staff (staffNo VARCHAR(5)，IName VARCHAR(15)，salary 
DECIMAL(7,2)); 

- INSERT INTO Staff VALUES (‘SG16’, ‘Brown’, 8300); 

- SELECT staffNo, IName, salary 
FROM Staff 
WHERE salary > 10000; 


© SQL 能 被 数据 库 管 理 员 、 管 理 人 员 、 应 用 程序 开发 者 和 各 类 终端 用 户 广泛 使 用 。 
目前 SQL 语言 已 有 国际 标准 ， 它 已 成 为 定义 和 操作 关系 数据 库 名 义 上 和 事实 上 的 标准 
(ISO, 1992, 2011a)。 
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6.1.2 SQL 的 历史 


正如 第 4 章 所 述 ， 关 系 模 型 (间接 SQL) 起 源 于 在 IBM San Jose WR E TEH E. F. 
Codd 发 表 的 一 篇 论文 (Codd，1970 )。1974 年 ， 该 研究 室 的 D. Chamberlin 定义 了 一 种 称 为 
SQL 的 结构 化 英语 查询 语言 ， 或 称 为 SEQUEL。1976 年 ， 其 修改 版 本 SEQUEL/2 出 现 ， 然 
后 正式 改名 为 SQL (Chamberlin and Boyce, 1974 ; Chamberlin et al., 1976), W5, A 
很 多 人 将 SQL 读 为 “See-Quel”， 尽 管 官 方 的 读 法 为 “S-Q-L”。 

IBM 在 SEQUEL/2 的 基础 上 推出 了 称 为 System R 的 DBMS 原型 ， 用 于 验证 关系 模型 的 
可 行 性 。 除 了 其 他 方面 的 成 果 外 ，System R 最 重要 的 成 果 是 开发 了 SQL。 但 是 SQL 的 最 初 
起 源 应 当 追 溯 到 System R 前 期 的 SQUARE (Specifying Queries As Relational Expression) if 
言 ， 它 是 一 种 用 英语 句子 表示 关系 代数 的 研究 用 语言 。 

20 世纪 70 年 代 末 期 ， 现 称 为 Oracle Corporation 的 公司 推出 了 第 一 个 基于 SQL 语言 
开发 的 商品 化 RDBMS 一 一 Oracle 数据 库 系统 。 不 久 ， 又 出 现 了 基于 QUEL 查询 语言 的 
INGRES 数据 库 系 统 ，QUEL 语言 和 SQL 语言 相 比 ， 结 构 化 特性 更 强 ， 但 与 英语 语句 不 大 
类 似 。 当 SQL 成 为 关系 数据 库 系 统 标准 语言 后 ，INGRES 也 转向 支持 SQL。1981 年 和 1982 
Æ, IBM 公司 分 别 在 DOS/VSE A VM/CMS 环境 下 推出 了 第 一 个 商品 化 RDBMS 一 一 SQL/DS 
数据 库 系 统 。 随 后 又 于 1983 年 在 MVS 环境 下 推出 DB2 数据 库 系统 。 

1982 年 ， 美 国 国家 标准 组 织 基 于 IBM 公司 提交 的 一 份 概念 性 建议 文件 开始 着 手 制 定 关 
系数 据 库 语言 (RDL) 的 标准 。1983 年 ，ISO 参与 这 一 工作 ， 并 共同 制定 了 SQL 标准 (名 
PK RDL 在 1984 年 后 不 再 使 用 ， 标 准 草案 转 为 与 已 有 的 各 种 SQL 实现 更 加 类 似 的 形式 )。 

1987 年 ，ISO 组 织 最 初 公布 的 标准 受到 有 关 人 士 的 严厉 批评 。 该 领域 内 一 位 很 有 影响 的 
研究 员 Date 声称 ， 诸 如 引用 完整 性 规则 和 某 些 关系 运算 符 等 一 些 重 要 的 特性 被 忽略 了 。 他 
还 指出 ， 该 语言 严重 元 余 ， 换 名 话说 可 用 多 种 方法 写 相 同 的 查询 语句 (Date, 1986, 1987a, 
1990 )。 许 多 批评 是 对 的 ， 而 且 标 准 组 织 在 公布 标准 之 前 已 有 所 认识 。 然 而 他 们 认为 ， 重 要 
的 是 尽早 公布 标准 ， 为 语言 和 实现 的 发 展商 定 基础 ， 而 不 是 等 到 人 们 认为 应 该 有 的 特性 全 都 
被 定义 和 认同 。 

1989 年 ，ISO 组 织 公 布 了 名 为 “完整 性 增强 特性 ”( Integrity Enhancement Feature) 的 
补充 文件 (ISO，1989 )。1992 年 ， 对 ISO 标准 进行 了 第 一 次 比较 大 的 修改 ， 称 为 SQL2 或 
SQL-92 (ISO，1992 )。 尽 管 一 些 特性 是 第 一 次 在 标准 中 提 及 ， 但 实质 上 ， 它 们 已 在 SQL iF 
多 实现 的 版 本 中 以 部 分 或 类 似 的 形式 得 以 体现 。 直 到 1999 年 ， 标 准 的 一 个 新 版 本 形成 ， 通 
常 称 为 SQL : 1999 (ISO，1999a)。 这 个 版 本 附加 了 包括 支持 面 回 对 象 数据 管理 等 特性 ， 将 
在 本 书 第 9 章 讨论 。 更 新 的 版 本 分 别 于 2003 FER ( SQL:2003 )、2008 年 夏 (SQL:2008 ) 
和 2011 年 年 末 (SQL:2011 ) FÆ. 

供应 商 在 标准 之 外 提供 的 特性 称 为 扩展 。 比 如 ，SQL 标准 仅 为 数据 库 中 的 数据 确定 了 六 
种 不 同 的 数据 类 型 。 许 多 实现 以 不 同 的 方式 扩展 了 这 个 数据 类 型 表 。SQL 的 每 个 实现 称 为 一 
种 方言 。 没 有 两 种 方言 完全 相同 ， 当 前 也 没有 方言 和 ISO 标准 完全 匹配 。 而 且 当 数据 库 供 
应 商 引 进 新 的 功能 时 ， 他 们 又 对 SQL 方言 进行 扩展 ， 使 其 离 标准 更 远 。 但 是 SQL 语言 的 核 
心 部 分 还 是 越 来 越 标准 化 了 。 实 际 上 ，SQL:2003 有 一 组 特性 称 为 核心 SQL， 供 应 商 必须 实 
现 这 组 特性 才能 宣称 与 SQL 标准 兼容 。 剩 下 的 许多 特性 被 分 别 打包 ， 例 如 面 问 对 象 特性 包 
和 联机 分 析 处 理 (OnLine Analytical Processing, OLAP) 包 等 。 
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虽然 SQL WAT IBM 公司 的 建议 , 但 是 其 重要 性 很 快 就 激发 其 他 供应 商 纷纷 推出 自己 的 
实现 。 时 至 今日 ， 数 百 个 基于 SQL 的 产品 在 应 用 ， 而 且 新 产品 还 在 不 断 涌现 。 


6.1.3 SQL 的 重要 性 


SQL 是 第 一 个 也 是 唯一 一 个 得 到 普通 认可 的 数据 库 标 准 语言 。 另 一 个 数据 库 标 准 语言 ， 
即 基 于 CODASYL 网 状 模 型 的 网 状 数据 库 语 言 (Network Database Language，NDL)， 只 有 
很 少 的 认同 者 。 几 乎 所 有 大 供应 商 开 发 的 数据 库 产 品 都 是 基于 SQL 或 与 SQL 接口 的 ， 这 
些 供应 商 大 多 数 都 是 标准 制定 组 织 的 成 员 。 供 应 商 和 用 户 都 在 SQL 语言 上 进行 了 大 量 的 投 
资 。SQL 已 成 为 应 用 体系 结构 的 一 部 分 ， 如 IBM 的 系统 应 用 体系 结构 (System Application 
Architecture, SAA). SQL 也 成 为 许多 大 型 的 、 有 影响 的 组 织 的 战略 性 选择 ， 如 支持 UNIX 
标准 的 Open Group 联 盟 。SQL 也 已 成 为 美国 联邦 信息 处 理 标准 (Federal Information 
Processing Standard，FIPS)， 销 售 给 美国 政府 的 所 有 数据 库 产品 都 需 满足 该 标准 。 供 应 商 的 
国际 联盟 SQL 访问 组 (SQL Access Group) 为 SQL 定义 了 一 组 增强 特性 以 支持 异 构 系 统 的 
互 操作 。 

SQL 也 被 其 他 标准 所 使 用 ， 甚 至 作为 一 种 定义 工具 影响 了 其 他 标准 的 发 展 。 比 如 ，ISO 
的 信息 资源 目录 系统 (Information Resource Dictionary System, IRDS) 标准 和 远程 数据 访问 
(Remote Data Access, RDA) 标准 。SQL 语言 的 开发 得 到 学 术 界 的 相当 的 关注 ， 不 仅 提 供 了 
语言 的 理论 基础 ， 而 且 提 供 成 功 实 现 所 需 的 技术 ， 尤 其 表现 在 查询 优化 、 数 据 分 布 和 安全 等 
方面 。SQL 面向 新 的 市 场 (比如 面向 联机 分 析 人 处 理 ) 而 专门 设计 的 实现 也 已 出 现 。 


6.1.4 术语 


ISO 组 织 公 布 的 SQL 标准 并 未 使 用 正式 术语 ， 如 关系 、 属 性 和 元 组 ， 而 是 采用 表 、 列 
和 行 这 样 的 术语 。 通 常 使 用 ISO 术语 表示 SQL 语句 。 注 意 ，SQL 并 不 严格 支持 第 4 章 给 
的 关系 模型 定义 。 例 如 ，SQL 允许 SELECT 语句 产生 的 结果 表 中 包含 重复 行 ， 它 还 强调 列 
的 顺序 ， 并 且 允 许 用 户 对 结果 表 中 的 行进 行 排 序 。 


6.2 书写 SQL 命令 


本 节 将 简要 描述 SQL 语句 的 结构 和 表示 各 种 结构 格式 的 方法 。SQL 语句 包括 保留 字 和 
用 户 自 定义 字 。 保 留 字 是 SQL 语言 的 固定 部 分 ， 有 固定 的 含义 。 保 留 字 必须 准确 拼写 ， 并 
且 不 能 跨行 拼写 。 用 户 自 定义 字 由 用 户 自己 定义 (根据 一 定 的 语法 规则 )， 用 于 表示 表 、 列 、 
视图 和 索引 等 数据 库 对 象 的 名 称 。 语 句 中 的 其 他 字 也 是 根据 一 定 的 语法 规则 和 定义 的 。 虽 然 标 
准 并 没有 要 求 ， 但 SQL 的 许多 种 实现 版 本 都 要 求 用 句子 终结 符 来 标识 SQL 语句 的 结束 〈 通 
HA “3” do 

SQL 语句 中 的 多 数组 成 部 分 是 不 区 分 大 小 写 的 ， 即 字母 用 大 写 或 小 写 均 可 。 唯 一 的 例 
外 是 字符 数据 常量 必须 与 其 在 数据 库 中 已 经 存在 的 大 小 写 形式 一 致 。 举 例 说 明 ， 若 某 人 的 姓 
用 “SMITH ”存储 ， 而 以 字符 串 “Smith ”查询 ， 将 查询 不 到 结果 。 

SQL 语言 格式 虽然 比较 自由 ， 但 为 了 增加 SQL 语句 和 语句 集 的 可 读 性 ， 可 采用 缩 进 和 
下 划 线 。 例 如 : 

e 语句 中 每 一 子 句 在 新 的 一 行 开 始 书 写 。 

e 每 一 子 句 与 其 他 子 句 的 开始 字符 处 在 同一 列 上 。 
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e 如 果子 句 由 几 个 部 分 组 成 ， 则 它们 应 当 分 别 出 现 在 不 同 的 行 ， 并 在 子 句 开始 处 使 用 
缩 进 表明 这 种 关系 。 
本 章 和 下 一 章 中 ， 将 用 扩展 的 巴克 斯 范式 (Backus Naur Form, BNF) 定义 SQL 语句 : 
e 大 写字 母 用 于 表示 保留 字 ， 必 须 准 确 拼写 。 
e 小 写字 峡 用 于 表示 用 户 自 定义 字 。 
竖 线 (|) 表示 从 选项 中 进行 选择 ， 例 如 al|blc。 
大 括号 表示 所 需 元 素 ， 例 如 | a |。 
中 括号 表示 可 选择 元 素 ， 例 如 [a] 。 
省 略 号 (… ) 表示 某 一 项 可 选择 重复 零 到 多 次 。 
例如 : 
{alb} (ee) 
意思 是 a 或 b 后 紧 跟 着 用 去 号 分 开 的 零 个 或 多 个 co 
RE, DDL 语句 用 于 建立 数据 库 结构 ( 即 表 ) 和 访问 机 制 ( 即 每 个 用 户 能 合法 访问 
什么 )， 而 DML 语句 用 于 查询 和 维护 表 。 但 本 章 先 于 DDL 讲述 DML 语句 ， 这 是 为 了 说 明 
DML 语句 对 普通 用 户 更 重要 。 下 一 章 将 讨论 主要 的 DDL 语句 。 


6.3 数据 操作 


SQL DML 语句 有 以 下 几 种 : 

e SELECT: 用 于 查询 数据 库 中 的 数据 。 

e INSERT: 用 于 将 数据 插入 表 中 。 

© UPDATE: 用 于 更 新 表 中 数据 。 

è DELETE: 用 于 删除 表 中 数据 。 

由 于 SELECT 语句 比较 复杂 ， 而 其 他 DML 语句 相对 简单 ， 所 以 本 节 将 用 大 部 分 篇 幅 分 
析 SELECT 语句 和 它 的 各 种 形式 ， 首 先 讲 解 简单 的 查询 ， 随 后 增加 排序 、 分 组 、 聚 集 和 涉 
及 多 个 表 的 复杂 查询 。 本 章 最 后 讨论 INSERT, UPDATE 和 DELETE 语句 。 

用 图 3-3 中 DreamHome 数据 库 来 说 明 SQL 语句 ， 包 括 下 面 各 表 : 


Branch (branchNo, street, city, postcode) 
Staff (staffNo, fName, IName, position, sex, DOB, salary, branchNo) 
PropertyForRent (propertyNo, street, city, postcode, type, rooms, rent, ownerNo, staffNo, 
branchNo) 
Client (clientNo, fName, IName, telNo, prefType, maxRent, eMail) 
PrivateOwner (ownerNo, fName, IName, address, telNo, eMail, password) 
Viewing (clientNo, propertyNo, viewDate, comment) 
常量 


讨论 SQL DML 之 前 ， 很 有 必要 理解 常量 的 概念 。 和 常量 是 指 SQL 语句 中 使 用 的 不 变量 。 
不 同 的 数据 类 型 有 不 同 的 常量 形式 (参见 7.1.1 节 )， 简 单 来 说 ， 常 量 可 以 分 为 用 引号 引起 来 
的 和 不 用 引号 的 。 所 有 非 数 值 型 数据 必须 用 单 引 号 引起 来 ， 而 所 有 数值 型 数据 一 定 不 能 使 用 
引号 。 例 如 ， 可 以 使 用 常量 将 数据 插入 到 表 中 : 


INSERT INTO PropertyForRent(propertyNo, street, city, postcode, type, rooms, rent, 
ownerNo, staffNo, branchNo) 


112 RABY KARBSBS 


VALUES (‘PAI4’, ‘16 Holhead’, ‘Aberdeen’, ‘AB7 5SU’, ‘House’, 6, 650.00, 
‘C046’, ‘SA9’, ‘B007’); 


列 rooms 的 值 是 整数 ， 列 rent 的 值 是 实数 ， 它 们 不 能 用 引号 引起 来 ， 其 他 列 的 值 均 为 
字符 串 ， 必 须 使 用 引号 。 
6.3.1 简单 查询 


SELECT 语句 用 于 检索 并 显示 一 个 或 多 个 数据 库 表 中 的 数据 。 它 功能 强大 ， 可 以 用 一 个 
语句 完成 关系 代数 中 选择 、 连 接 和 投影 操作 (参见 5.1 节 )。SELECT 也 是 SQL 命令 中 使 用 
频率 最 高 的 语句 ， 其 形式 如 下 : 


SELECT [DISTINCT | ALL] {* | [columnExpression [AS newName]] [, . . .]} 
FROM TableName [alias] [, . . .] 
condition] 


[GROUP BY columnList] [HAVING condition] 
[ORDER BY columnList] 


columnExpression 为 一 个 列 名 称 或 表达 式 ，TableName 给 出 欲 访 问 数据 库 中 的 表 或 视图 
的 名 称 ，alias 是 可 选用 的 TableName 的 简称 。SELECT 语句 处 理 过 程 顺序 如 下 : 


FROM 给 出 将 用 到 的 表 

WHERE 过 滤 满 足 条 件 的 行 

GROUP BY 将 具有 相同 属性 值 的 行 分 成 组 
HAVING 过 滤 满 足 条 件 的 组 

SELECT 指定 查询 结果 中 出 现 的 列 
ORDER BY 指定 查询 结果 的 顺序 


SELECT 语句 中 子 句 的 顺序 不 能 改变 ， 仅 有 最 开始 的 两 个 子 句 SELECT 和 FROM 是 必 
需 的 ， 其 余子 句 均 为 可 选择 的 。SELECT 操作 为 封闭 的 ， 即 查询 表 的 结果 将 用 男 一 张 表 显 示 
(参见 5.1 节 )。 该 语句 有 多 种 变形 ， 正 如 刚才 解释 的 那样 。 


检索 所 有 的 行 
| 例 6.1 >> 检索 所 有 的 列 和 所 有 的 行 


列举 所 有 员工 的 情况 。 
因为 本 次 查询 没有 条 件 限制 ， 故 省 略 WHERE 子 句 ， 查 询 所 有 的 列 ， 语句 如 下 : 


SELECT staffNo, fName, IName, position, sex, DOB, salary, branchNo 
FROM Staff; 


因为 SQL tA ARR ART AH, LA — i A AeA Hr A RS“ AE A 
列 ” 的 名 称 。 下 面 的 语句 就 是 该 查询 等 效 而 简洁 的 表达 方式 : 


SELECT * 
FROM Staff; 


查询 结果 如 表 6-1 所 示 。 «< 
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表 6-1 例 6.1 的 查询 结果 表 


| 例 6.2 为 从 所 有 行 中 检索 指定 的 列 

生成 所 有 员工 的 工资 表 ， 只 包括 员工 编号 、 姓 名 及 工资 。 

SELECT staffNo, fName, IName, salary 

FROM Staff; 

例子 中 ， 从 表 Staff 中 按 指 定 的 顺序 产生 仅 包 
含 指定 列 staffNo, fName, [Name 和 salary 的 一 个 
新 表 。 查 询 输出 如 表 6-2 所 示 。 注 意 ， 除 非 指 定 顺 
序 ， 否 则 查询 结果 便 不 会 自动 被 排序 。 一 些 DBMS 
基于 一 个 或 多 个 列 对 查询 结果 进行 排序 (例如 ， 
Microsoft Office Access 将 会 按 主 关键 字 staffNo 对 
查询 结果 进行 分 类 )。 下 一 和 章 将 讨论 如 何 对 查询 结 
果 进 行 排序 。 « 
| 例 6.3 >) 使 用 DISTINCT 

列 出 被 查看 过 的 所 有 房产 的 编号 。 

SELECT propertyNo 

FROM Viewing; 

查询 结果 如 表 6-3a 所 示 。 注 意 ， 结 果 中 出 现 重复 ，SELECT 语句 不 会 像 关系 代数 的 投 
影 操 作 那 样 自动 消除 重复 。 用 保留 字 DISTINCT 可 消除 重复 。 下 面 重 写 查询 : 


3-Jun-40 24000.00 B003 
13-Jun-65 9000.00 B005 


R 6-2 例 6.2 的 查询 结果 表 












30000.00 










12000.00 
18000.00 
9000.00 
24000.00 
9000.00 


SELECT DISTINCT propertyNo 
FROM Viewing; 
没有 重复 的 查询 结果 如 表 6-3b 所 示 。 « 
R 6-3(a) 例 6.3 中 有 重复 的 查询 结果 表 表 6-3(b) 例 6.3 中 无 重复 的 查询 结果 表 
i ree eae propertyNo 
PAI4 PA14 
PG4 PG4 
PG4 PG36 
PA14 


PG36 
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| $16.4 3 计算 字段 
生成 所 有 员工 的 月 工资 列表 ,包括 员工 编号 、 姓 名 及 工资 。 


SELECT staffNo, fName, IName, salary/12 
FROM Staff; 


该 查询 类 似 于 例 6.2, 不同 之 处 在 于 需要 查询 的 是 每 月 工资 。 查 询 结 果 可 以 通过 简单 的 
将 年 工资 除 以 12 得 到 。 结 果 如 表 6-4 所 示 。 


表 6-4 例 6.4 的 查询 结果 表 


Sua r 750.00 


本 例 是 使 用 计算 字段 (有 时 称 为 导出 字段 ) 的 例子 。 通 常 ， 使 用 计算 字段 时 ， 在 
SELECT 列表 中 给 出 SQL 表达 式 ， 包 括 加 、 减 、 乘 和 除 运 算 。 另 外 ， 可 以 使 用 括号 来 建立 
复杂 的 表达 式 。 表 中 可 有 多 个 使 用 计算 字段 的 列 。 而 且 ， 算 术 表 达 式 所 引用 的 列 必须 是 数字 
类 型 。 

该 查询 结果 表 中 第 4 列 就 是 输出 列 col4。 通 常 结果 表 的 列 名 应 当 和 用 于 检索 的 数据 库 的 
列 名 相对 应 。 但 是 本 例 这 种 情况 下 ，SQL 并 不 知道 如 何 标识 列 。 惯 用 方法 是 根据 列 在 表 中 的 
位 置 来 命名 (例如 ，col4 )。 在 一 些 方言 中 ，SELECT 列表 中 列 名 为 空白 或 者 用 表达 式 写 人 。 
ISO 标准 允许 用 AS 子 句 为 列 命 名 。 前 面 的 例子 可 以 写 为 : 


SELECT staffNo, fName, IName, salary/12 AS monthlySalary 
FROM Staff; 


这 样 ， 查 询 结 果 中 的 列 将 是 monthlySalary 而 不 是 col4。 (E 
行 选择 (WHERE 子 句 ) 

上 面 例 子 用 SELECT 语句 检索 表 中 的 所 有 行 。 事 实 上 ， 我 们 经 常 需要 限制 仅 检 索 某 些 
行 ， 这 时 可 用 WHERE 子 名 实现， 包括 关键 字 WHERE 和 其 后 给 定 的 用 于 检索 行 的 查询 条 
件 。 五 个 基本 的 条 件 运算 USO 术语 中 的 谓词 ) 如 下 : 

e 比较 (comparison); 比较 两 个 表达 式 的 值 。 

e 范围 (range): 测试 表达 式 的 值 是 否 在 指定 的 范围 中 。 

© 成员 关系 (set membership): 测试 表达 式 的 值 是 否 在 某 一 值 集合 内 。 

e 模式 匹配 (pattern match): 测试 字符 串 是 否 与 指定 模式 相 匹 配 。 

è Z (null): 测试 列 是 否 为 空 (RA) 值 。 

WHERE 子 句 等 价 于 5.1.1 节 讨 论 的 关系 代数 的 选择 操作 。 现 列 出 各 种 查找 条 件 的 例子 。 


| 例 6.5 D 比较 运算 作为 查找 条 件 
列 出 工资 高 于 10000 英镑 的 所 有 员工 。 
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SELECT staffNo, fName, IName, position, salary 
FROM Staff 
WHERE salary > 10000; 


其 中 ， 表 是 Staff， 谓 词 是 salary>10000， 查 询 结 果 产 生 一 个 工资 高 于 10000 英镑 的 所 
有 员工 的 列表 。 查 询 结果 如 表 6-5 所 示 。 « 


R 6-5 例 6.5 的 查询 结果 表 


staffNo fName | IName | _ positon salary 

S121 John 30000.00 
SG37 Ann Beech 12000.00 
SG David 18000.00 


SQL 语句 中 可 用 的 比较 运算 符 如 下 : 


= 等 于 

<> AF (ISO 标准 ) = 不 等 于 ( 某 些 方言 这 样 用 ) 
< 小 于 <= 小 于 或 等 于 

> KT >= 大 于 或 等 于 


复杂 的 谓词 可 由 逻辑 运算 符 AND. OR 和 NOT 产生 ， 必 要 或 期 望 时 可 用 括号 表示 计算 
的 顺序 。 计 值 条 件 表达 式 的 规则 如 下 : 

e 计 值 顺序 由 左 至 右 。 

e 首先 计 括 号 中 子 表 达 式 的 值 。 

e NOT 优先 于 AND 和 OR. 

e AND 优先 于 OR。 

可 运用 括号 消除 歧义 。 
| 例 6.6 》》 复合 比较 运算 作为 查找 条 件 

列 出 位 于 伦敦 或 格拉 斯 哥 的 所 有 分 公司 的 地 址 。 

SELECT * 

FROM Branch 

WHERE city = ‘London’ OR city = ‘Glasgow’; 

逻辑 运算 符 OR F WHERE FA, HFE EREZA (city='London') 或 格拉 斯 哥 
(city='Glasgow') 的 分 公司 。 查 询 结果 如 表 6-6 HZR o « 


R 6-6 例 6.6 的 查询 结果 表 
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| 例 6.7 >» 范围 作为 查找 条 件 (BETWEEN/NOT BETWEEN) 
列 出 工资 在 20 000 英镑 和 30 000 英镑 之 间 的 所 有 员工 。 


SELECT staffNo, fName, IName, position, salary 
FROM Staff 
WHERE salary BETWEEN 20000 AND 30000; 


BETWEEN 测试 包括 范围 的 端点 ， 所 以 查询 结果 包括 工资 为 20 000 英镑 和 30 000 英镑 
的 职工 。 查 询 结 果 如 表 6-7 所 示 。 


表 6-7 例 6.7 的 查询 结果 表 


不 在 范围 测试 (NOT BETWEEN) 检查 范围 以 外 的 所 有 值 。BETWEEN 测试 并 不 能 增强 
SQL 的 功能 ， 因 为 通过 使 用 两 个 比较 表达 式 也 可 以 完成 相同 的 功能 。 可 以 这 样 表达 上 面 的 
查询 : 


SELECT staffNo, fName, IName, position, salary 


FROM Staff 
WHERE salary > = 20000 AND salary < = 30000; 
BETWEEN 测试 只 是 简化 了 范围 运算 条 件 的 表达 。 « 


| 例 6.8 >» 集合 成 员 测试 作为 查找 条 件 (IN/NOT IN) 
列 出 所 有 的 经 理 和 主管 。 


SELECT staffNo, fName, IName, position 
FROM Staff 
WHERE position IN (“Manager’, ‘Supervisor’); 
合成 员 资格 测试 CN) 用 于 测试 数据 是 否 与 值 表 中 的 某 一 值 相 匹 配 ,- 本 例 中 就 是 
“Manager ”或 “Supervisor”。 查 询 结 果 如 表 6-8 所 示 。 


表 6-8 例 6.8 的 查询 结果 表 


SG14 David 


staffNo 


Ford Supervisor 


非 集 合成 员 资 格 测试 (NOT IN) 用 于 测试 数据 是 否 不 在 指定 的 值 表 中 。 像 BETWEEN 
一 样 ，IN 测试 并 不 能 增强 SQL 的 表达 功能 。 上 面 的 查询 可 以 如 下 表达 : 


SG5 


SELECT staffNo, fName, |Name, position 
FROM Staff 
WHERE position = ‘Manager’ OR position = ‘Supervisor’; 


但 是 ，TN 测试 提供 了 更 加 有 效 的 查询 条 件 表 达 方 式 ， 特 别 是 集合 中 包括 多 个 值 时 。 « 
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| 例 6.9 >> 模式 匹配 作为 查找 条 件 (LIKE/NOT LIKE) 

找 出 其 地 址 中 含有 字符 串 “Glasgow” 的 所 有 业主 。 

该 查询 是 从 表 PrivateOwner 中 查询 地 址 中 包括 字符 串 “ Glasgow” 的 行 。SQL 有 两 种 
特殊 的 模式 匹配 符号 : 

© %: 百 分 号 表示 零 或 多 个 字符 序列 (通配符 )。 

©: 下 划 线 表示 任意 单个 字符 。 

模式 匹配 中 还 有 其 他 字符 ， 例 如 : 
address LIKE“H9% ”意味 着 字符 串 第 一 个 字符 必须 是 HH， 对 其 他 字符 不 做 限制 。 
address LIKE“H__ ”意味 着 字符 串 正 好 有 四 个 字符 ， 第 一 个 字符 为 H。 
address LIKE“%e ”意味 着 一 个 字符 序列 ,长度 最 小 为 1， 最 后 一 个 字符 为 e。 
address LIKE“% Glasgow % ”意味 着 一 个 包含 字符 串 Glasgow 的 任意 长 度 序列 。 
address NOT LIKE“H% ”意味 着 字符 串 第 一 个 字符 不 能 为 H。 

如 果 查 找 的 字符 串 本 身 包 含 上 述 模式 匹配 符 ， 则 可 用 转 义 字符 。 例 如 ， 匹 配 字符 串 
‘15% ”用 下 列 谓词 : 

LIKE ‘15#% ESCAPE ‘#’ 


利用 SQL 的 模式 匹配 ， 可 以 查询 地 址 中 包括 字符 串 “ Glasgow” 的 所 有 业主 。 查 询 语 
名 如 下 : 


SELECT ownerNo, fName, IName, address, telNo 
FROM PrivateOwner 
WHERE address LIKE ‘%Glasgow%’; 


注意 : —#£ RDBMS, 4l Microsoft Office Access ， 使 用 通配符 * 和 ? REAA o 
查询 结果 如 表 6-9 所 示 。 « 


表 6-9 例 6.9 的 查询 结果 表 


| 例 6.10 >> 空 查找 条 件 (IS NULL/IS NOT NULL) 

列 出 查看 过 房产 编号 为 PG4 的 房产 但 没有 留 下 意见 的 客户 的 情况 。 

从 图 4-3 中 的 Viewing 表 中 可 以 看 出 关于 PG4 有 两 种 情况 ， 一 种 有 评论 ， 另 一 种 没有 。 
你 可 能 认为 后 者 可 用 下 面 任 一 个 表达 式 查 询 : 

(propertyNo = ‘PG4’ AND comment = * ’) 
或 

(propertyNo = ‘PG4’ AND comment < > ‘too remote’) 

然而 ， 两 种 方式 都 是 无 效 的 。 空 评论 可 以 被 认为 是 一 个 未 知 值 ， 不 能 测试 它 是 否 等 于 
为 一 个 字符 串 。 夺 用 上 面 的 复合 条 件 ， 得 到 的 结果 将 是 一 个 空 表 。 相 反 ， 用 特定 保留 字 IS 
NULL 可 显 式 地 测试 空 值 : 
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SELECT clientNo, viewDate 


FROM Viewing 

WHERE propertyNo = ‘PG4’ AND comment IS NULL; 表 6-10 例 6.10 的 查询 结果 表 

查询 结果 如 表 6-10 所 示 。 其 否定 形式 IS NOT CASHES viewDate 
NULL 用 于 测试 非 空 值 情 况 。 《€ CR56 26-May-13 


6.3.2 ”查询 结果 排序 (ORDER BY FA) 


一 般 来 说 ，SQL 查询 结果 中 的 各 行 不 会 自动 以 某 种 顺序 来 显示 (虽然 有 一 些 DBMS 基 
于 默认 顺序 ， 例 如 基于 主 关 键 字 )。 这 时 ， 可 以 使 用 ORDER BY 子 句 让 查询 结果 按 一 定 顺 序 
显示 。ORDER BY 子 句 包括 所 需 排 序 的 列 标识 符 的 列表 ， 用 逗号 分 开 。 列 标识 符 可 能 是 列 
名 字 或 是 列 序号 9， 列 序号 是 指 列 在 SELECT 列表 中 的 位 置 ,“1” 标 识 列 表 中 第 一 个 (最 左 
边 ) 元 素 ,“2” 标 识 列表 中 第 二 个 元 素 ， 以 此 类 推 。 当 被 排序 的 列 是 表达 式 并 且 没 有 使 用 过 
AS 子 句 赋予 列 将 来 可 能 引用 的 名 字 时 ， 可 以 用 列 序号 。ORDER BY 子 句 允许 导出 的 行 在 任 
一 列 或 多 个 列 上 按 升序 (ASC) 或 降序 (DESC) 排列 ， 而 不 管 列 是 否 出 现在 查询 结果 中 。 然 
而 ， 一 些 实现 版 本 要 求 ORDER BY 子 句 中 的 元 素 必须 出 现在 SELECT 列表 中 。 不 论 是 哪 一 
种 情况 ，ORDER BY 子 句 都 只 能 是 SELECT 语句 的 最 后 一 个 子 句 。 


| 例 6.11 >> 单列 排序 

按 工资 降序 的 方式 产生 所 有 职工 的 工资 列表 。 

SELECT staffNo, fName, IName, salary 

FROM Staff 

ORDER BY salary DESC; 

本 例 类 似 于 例 6.2， 不 同 在 于 此 处 查询 结果 按 工资 降序 排列 。 这 主要 由 SELECT 语句 最 
后 的 ORDER BY 子 句 完 成 ， 指 定 列 salary 用 于 排序 ， 并 使 用 DESC 表示 按 降序 排列 。 查 询 
结果 如 表 6-11 所 示 。 注 意 ， 还 可 以 这 样 表达 ORDER BY TAJ: ORDER BY 4 DESC，4 表 
示 SELECT 列表 中 第 4 列 的 名 字 ， 即 为 salary。 « 


6-11 例 6.11 的 查询 结果 表 


SA9 Mary 9000.00 
SL41 Lee 9000.00 


ORDER BY 子 句 可 能 包括 多 个 元 素 ， 主 排序 关键 字 决 定 查询 结果 总 体 的 排序 。 例 6.11 
中 ， 主 排序 关键 字 是 salary。 如 果 主 关键 字 是 唯一 的 ， 那 么 就 没有 必要 引入 第 二 个 关键 字 来 
控制 顺序 。 然 而 ， 如 果 主 排序 关键 字 的 值 不 是 唯一 的 ， 查 询 结果 中 就 会 有 多 个 行 对 应 主 排序 


O ” 列 序 号 是 1SO 标准 中 为 人 诉 病 的 特性 之 一 ， 不 应 该 使 用 。 
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关键 字 的 同一 个 值 ， 这 种 情况 下 ， 可 以 增加 一 个 排序 关键 字 来 控制 主 排序 关键 字 相 同 的 那些 
行 的 顺序 。ORDER BY 子 句 中 的 第 二 个 元 素 也 称 为 次 排序 关键 字 。 


| 例 6.12 >> 多 列 排序 
产生 按 类 型 排列 的 一 个 房产 简 表 。 


SELECT propertyNo, type, rooms, rent 
FROM PropertyForRent 
ORDER BY type; 


这 种 情况 下 ， 查 询 结果 如 表 6-12a 所 示 。 
表 中 出 现 四 个 公寓 ， 如 果 不 指定 次 排序 关键 字 ， 系 统 可 以 任何 顺序 对 行 排序 。 此 时 ， 可 
再 以 租金 为 序 组 织 房产 ， 需 指定 次 要 顺序 ， 如 下 : 


SELECT propertyNo, type, rooms, rent 
FROM PropertyForRent 
ORDER BY type, rent DESC; 


现在 ， 查 询 结 果 首 先 以 房产 类 型 升序 排列 (默认 值 为 ASC)， 对 于 相同 的 房产 类 型 ， 以 
rent 降序 排列 ， 查 询 结 果 如 表 6-12b TAN. 


R 6-12(a) 例 6.12 单 排序 关键 字 的 查询 结果 表 R 6-12(b) Bi 6.12 两 个 排序 关键 字 的 查询 结果 表 


propertyNo | type | rooms | rent propertyNo | type | rooms | rent 


ISO 标准 指出 , # ORDER BY 子 句 中 用 于 排序 的 列 或 表达 式 取 空 值 ， 则 既 可 以 认为 空 值 
小 于 所 有 的 非 空 值 ， 也 可 认为 空 值 大 于 所 有 的 非 空 值 。 这 个 选择 权 留 给 了 DBMS 实现 者 。 «KC 


6.3.3 ”使 用 SQL 聚集 函数 


“为 了 便于 获取 数据 库 中 的 行 和 列 ， 我 们 通常 希望 对 数据 进行 汇总 和 聚集 操作 ， 类 似 于 报 
表 底 部 的 合计 。ISO 标准 定义 了 五 个 聚集 郴 数 : 

© COUNT: 返回 指定 列 中 数据 的 个 数 。 

e SUM: 返回 指定 列 中 数据 的 总 和 。 

e AVG: 返回 指定 列 中 数据 的 平均 值 。 

e MIN: 返回 指定 列 中 数据 的 最 小 值 。 

e MAX: 返回 指定 列 中 数据 的 最 大 值 。 

这 些 函 数 只 对 表 中 的 单个 列 进行 操作 ， 返 回 一 个 值 。COUNT MIN 和 MAX 可 以 用 于 
数值 和 非 数 值 字段 ， 而 SUM 和 AVG 只 能 用 于 数值 字段 ， 除 了 COUNT (*) Jb, — PR 
数 首先 要 去 掉 空 值 ， 然 后 计算 其 非 空 值 。COUNT (*) 是 COUNT 的 特殊 用 法 ， 计 算 表 中 所 
有 行 的 数目 ， 而 不 管 是 否 有 空 值 或 重复 出 现 。 

若 需 要 在 应 用 函数 之 前 消除 重复 ， 则 必须 在 函数 中 的 列 名 前 使 用 关键 字 DISTINCT。 如 
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果 不 需 要 去 掉 重 复 ，ISO 标准 允许 指定 关键 字 ALL, 虽然 指定 这 个 关键 字 事 实 上 跟 不 指定 
没有 什么 区 别 。DISTINCT 对 MIN Al MAX 函数 没有 任何 作用 ， 而 对 SUM All AVG 函数 
有 效 。 所 以 计算 时 必须 考虑 重复 项 是 否 包 括 在 计算 中 。 男 外 ， 查 询 中 DISTINCT 只 能 指定 
一 次 。 

注意 聚集 函数 只 能 用 于 SELECT 列表 和 HAVING 子 句 中 (参见 6.3.4 节 )， 用 在 其 他 地 
方 都 是 不 正确 的 。 如 果 SELECT 列表 包括 聚集 函数 ， 却 没有 使 用 GROUP BY 子 句 分 组 ， 那 
么 SELECT 列表 的 任何 项 都 不 能 引用 列 ， 除 了 作为 聚集 函数 的 参数 。 人 例如， 下面 的 查询 是 
非法 的 : 


SELECT staffNo, COUNT(salary) 
FROM Staff; 


因为 查询 中 没有 GROUP BY FAJ, H SELECT 列表 中 出 现 了 列 staffNo， 它 并 不 是 聚集 
PRI AY) BX E 


| 例 6.13 » COUNT (*) 的 使 用 
月 租金 超过 350 英镑 的 房产 有 多 少 处 ? 


SELECT COUNT(*) AS myCount 
FROM PropertyForRent 
WHERE rent > 350; 


用 WHERE 子 句 限制 查询 每 月 租金 超过 350 英镑 的 
房产 ,满足 该 条 件 的 房产 总 数 通 过 聚集 函数 COUNT 得 dat 
出 。 查 询 结果 如 表 6-13 所 示 。 « À 


R 6-13 例 6.13 的 查询 结果 表 


| 例 6.14 >} COUNT (DISTINCT) 的 使 用 

2013 年 5 月 有 多 少 处 不 同 的 房产 被 查看 过 ? 

SELECT COUNT(DISTINCT propertyNo) AS myCount 

FROM Viewing 

WHERE viewDate BETWEEN 1-May-13 AND ‘31-May-13’; 

用 WHERE 子 句 将 查看 房产 的 时 间 限 定 在 2013 年 5 表 6-14 HIG. 14 的 查询 结果 表 
A, 满 吓 条 件 的 总 数 通 过 聚集 函数 COUNT 得 出 。 这样 
相同 的 房产 被 重复 计数 ， 必 须 用 DISTINCT 关键 字 去 掉 
重复 。 查 询 结 果 如 表 6-14 所 示 。 < 


myCount 


2 


| Gi] 6.15 >» COUNT 和 SUM 的 使 用 

找 出 经 理 的 总 人 数 ， 并 计算 他 们 工资 的 总 和 。 

SELECT COUNTI(staffNo) AS myCount, SUM(salary) AS mySum 

FROM Staff 

WHERE position = ‘Manager’; 

6-15 6.15 Ei 

用 WHERE 子 句 限制 对 经 理 进行 查询 。 经 理 人 数 和 工资 BOTS BOIS 的 查询 结果 家 
总 和 分 别 通过 将 COUNT 和 SUM 函数 应 用 于 受 限 集合 而 得 "Yeount 
出 。 查 询 结 果 如 表 6-15 所 示 。 « 2 54000.00 
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| 例 6.16 >>» MIN, MAX 和 AVG 的 使 用 
KAA RL RAR. RAPA. 
SELECT MIN(salary) AS myMin, MAX(salary) AS myMax, AVG(salary) AS myAvg 


FROM Staff; 

这 个 例子 是 查找 所 有 员工 的 工资 情况 ， 所 表 6-16 例 6.16 的 查询 结果 表 
以 不 需要 WHERE 子 句 。 对 于 列 salary， 利 用 myMin myAvg 
MIN, MAX 和 AVG eR CK Hi m SEA. AA 9000.00 17000.00 
结果 如 表 6-16 FIT AS o {« 


6.3.4 查询 结果 分 组 (GROUP BY FA) 

上 面 汇总 查询 的 结果 相当 于 报表 底部 的 合计 值 。 报 表 中 将 查询 结果 用 一 个 汇总 行 表示 ， 
而 缩 简 了 细节 数据 。 通 常 报 表 中 也 需要 有 部 分 和 和， 可 用 GROUP BY 子 句 实现 这 种 功能 。 包 
括 GROUP BY 子 句 的 查询 称 为 分 组 查询 ， 按 SELECT 列表 中 的 列 进行 分 组 ， 每 一 组 产生 

一 个 综合 查询 结果 。GROUP BY- 子 句 的 列 名 又 称 为 组 列 名 。ISO 标准 要 求 SELECT FAA 

GROUP BY 子 句 紧密 结合 。 当 使 用 GROUP BY Ht, SELECT 列表 中 的 项 必须 每 组 都 有 单一 
值 。SELECT 子 句 仅 可 包括 以 下 内 容 : 

e 列 名 

o 聚集 函数 

e 常量 

e 组 合 上 述 各 项 的 表达 式 

SELECT 子 句 中 的 所 有 列 除非 用 在 聚集 函数 中 ， 否则 必须 在 GROUP BY 子 句 中 出 
M, Z, GROUP BY 子 句 中 出 现 的 列 不 一 定 出 现在 SELECT 列表 中 。 当 WHERE FAA 
GROUP BY 子 句 同时 使 用 时 ， 必 须 首 先 使 用 WHERE 子 句 ， 分 组 由 满足 WHERE 子 句 查询 
条 件 的 那些 行 产生 。 

ISO 标准 规定 应 用 GROUP BY 子 句 时 ， 两 个 空 值 被 认为 是 相等 的 。 即 如 果 两 行 在 同 
一 分 组 列 上 值 都 为 空 值 ， 并 且 在 不 含 空 值 的 分 组 列 上 值 相 等 ， 则 这 两 行将 被 合并 到 同一 
组 中 。 


| 例 6.17 >» GROUP BY 的 使 用 
找 出 工作 在 每 一 个 分 公司 的 员工 人 人数 和 他 们 的 工资 总 和 。 
SELECT branchNo, COUNT!(staffNo) AS myCount, SUM(salary) AS mySum 


FROM Staff 

GROUP BY branchNo 

ORDER BY branchNo; 

GROUP BY 列表 中 不 必 包 括 列 名 staffNo 和 salary， 因 为 其 仅 出 现在 SELECT 列表 的 聚 
集 图 数 中 。 男 一 方面 ，branchNo 没有 出 现在 时 6-17 6.17 的 查询 结果 表 





集 函 数 中 ， 所 以 必须 出 现在 GROUP BY 列表 中 。 
查询 结果 如 表 6-17 所 示 。 

理论 上 ，SQL 按 下 列 步 又 完成 查询 : 

(1) SQL 根据 分 公司 编号 将 员工 分 成 不 同 的 
组 。 每 一 组 中 ， 所 有 员工 有 相同 的 分 公司 编号 。 


branchNo 











54000.00 





39000.00 
9000.00 
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本 例 中 ， 共 有 三 组 : 


branchNo | COUNT(staffNo) | SUM(salary) 





(2) 每 一 组 中 ，SQL 计算 员工 的 人 数 ， 并 计算 出 salary 列 的 汇总 以 便 得 到 员工 薪水 的 总 
和 。SQL 在 查询 结果 中 为 每 一 组 生成 一 个 单独 的 汇总 行 。 
(3) 最 后 ， 查 询 结 果 按 分 公司 编号 branchNo 的 升序 排列 。 
SQL 标准 允许 SELECT Fi Ze FREE AA (参见 6.3.5 节 )， 因 而 可 用 下 面 的 语句 表 
达 上 面 的 查询 : 
SELECT branchNo, (SELECT COUNT/(staffNo) AS myCount 
FROM Staff s 
WHERE s.branchNo = b.branchNo), 
(SELECT SUM(salary) AS mySum 
FROM Staffs 
WHERE s.branchNo = b.branchNo) 
FROM Branch b 
ORDER BY branchNo; | 
该 例 中 ， 将 为 Branch 列 中 的 每 个 分 公司 产生 两 个 聚集 函数 值 ， 某 些 情况 下 聚集 值 可 能 
为 零 。 « 


分 组 约束 (HAVING 子 句 ) 

HAVING 子 名 的 设计 意图 是 与 GROUP BY 子 句 一 起 使 用 ， 来 限定 哪些 分 组 将 出 现在 
最 终 查询 结果 中 。 虽 然 它 与 WHERE 子 句 语法 类 似 ， 但 用 途 不 同 。WHERE 子 句 将 单个 行 
“过 滤 ” 到 查询 结果 中 ， 而 HAVING 子 句 则 将 分 组 “过 滤 ” 到 查询 结果 表 中 。ISO 标准 要 求 
HAVING 子 句 使 用 的 列 名 必须 出 现在 GROUP BY 子 句 列表 中 ， 或 包括 在 聚集 函数 中 。 实 际 
H, HAVING 子 句 的 条 件 运 算 至 少 包括 一 个 聚集 函数 ， 和 否则 的 话 可 把 查询 条 件 移 到 WHERE 
子 句 中 来 过 滤 单 个 行 〈 记 住 聚 集 函 数 不 能 用 在 WHERE 子 句 中 )。 

HAVING 子 句 并 不 是 SQL 的 必要 部 分 一 一 任何 使 用 HAVING 子 句 的 查询 都 可 用 不 带 
HAVING 子 句 的 语句 重 写 。 


| 例 6.18 >>) HAVING 的 使 用 

对 于 员工 人 数 多 于 一 人 的 分 公司 ， 计 算出 每 一 个 分 公司 的 员工 人 数 和 他 们 的 工资 总 和 。 

SELECT branchNo, COUNT(staffNo) AS myCount, SUM(salary) AS mySum 

FROM Staff 

GROUP BY branchNo 

HAVING COUNT /(staffNo) > 1 

ORDER BY branchNo; 

此 例 类 似 于 前 面 讲 过 的 附加 约束 的 例子 ， 只 找 出 员工 人 数 超 过 一 人 的 分 组 ， 可 用 
HAVING 子 句 对 分 组 进行 约束 。 查 询 结 果 如 表 6-18 所 示 。 « 
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6-18 例 6.18 的 查询 结果 表 


B005 39000.00 


6.3.5 FRA 


本 节 讨 论 将 SELECT if 4) 5é KE aAA SELECT 语句 中 的 用 法 。 内 部 SELECT 
语句 (FRA) 的 结果 用 在 外 部 语句 中 以 决定 最 后 的 查询 结果 。 子 查询 可 以 被 使 用 在 外 部 
SELECT 语句 的 WHERE 和 HAVING 子 句 中 ， 称 为 子 查询 或 垦 套 查询 。 子 查询 也 可 出 现在 
INSERT, UPDATE 和 DELETE 语句 中 (参见 6.3.10 节 )。 子 查询 有 三 种 类 型 : 

© 标量 子 查询 返回 单个 列 和 单个 行 ， 即 单个 值 。 原 则 上 ， 标 量子 查询 可 用 于 任何 需要 

单个 值 的 地 方 。 例 6.19 使 用 标量 子 查询 。 

© 行 子 查询 返回 多 个 列 ， 但 只 有 单个 行 。 行 子 查询 可 用 于 任何 需要 行 值 构造 器 的 时 候 ， 

如 在 谓词 中 。 
e 表 子 查询 返回 多 个 行 ， 每 行 有 一 个 或 多 个 列 。 表 子 查询 用 于 需要 一 个 表 的 情况 。 例 
如 ， 作 为 谓词 IN 的 操作 数 。 


| 例 6.19 入 用 于 相等 判断 的 子 查询 
列 出 在 位 于 “163 Main St” 的 分 公司 中 工作 的 员工 的 情况 。 
SELECT staffNo, fName, IName, position 
FROM Staff 
WHERE branchNo = (SELECT branchNo 
FROM Branch 
WHERE street = ‘163 Main St’); 
内 部 SELECT 语句 (SELECT branchNo FROM Branch...) 找 出 位 于 “163 Main St” AY 
分 公司 的 编号 (如果 只 有 一 个 分 公司 编号 ， 便 是 标量 查询 )。 外 部 SELECT 语句 找 出 工作 
在 此 分 公司 的 所 有 员工 的 情况 。 换 句 话说， 内 部 查询 返回 一 个 与 “163 Main St” 对 应 的 值 
“B003”， 外 部 查询 语句 变 为 : 


SELECT staffNo, fName, IName, position 


FROM Staff 
WHERE branchNo = ‘B003’; 
查询 结果 如 表 6-19 所 示 。 « 
表 6-19 例 6.19 的 查询 结果 表 
staffNo pe Pe Rf position 
5637 rer 
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可 以 认为 子 查询 产生 一 个 临时 表 , 便于 外 部 语句 访问 和 利用 。 在 WHERE 子 句 和 
HAVING 子 句 中 ， 子 查询 可 以 紧邻 着 关系 运算 符 (=, <, >, <=, >=, < >)。 了 于 查询 本 身 通常 
包括 在 圆 括号 中 。 


| 例 6.20 > 用 于 聚集 函数 的 子 查询 
列 出 个 人 工资 高 于 平均 工资 的 所 有 员工 ， 并 求 出 多 于 平均 数 的 值 。 


SELECT staffNo, fName, IName, position, 


salary — (SELECT AVG(salary) FROM Staff) AS salDiff 
FROM Staff 


WHERE salary > (SELECT AVG(salary) FROM Staff); 

首先 注意 ， 不 能 写 “ WHERE salary > AVG ( salary)” ， 因 为 聚集 函数 不 能 用 于 WHERE 
子 名 中。 相反 ， 先 用 子 查询 求 出 平均 工资 ， 然 后 使 用 外 部 SELECT 语句 找 出 那些 工资 高 于 
平均 数 的 员工 。 换 名 话说 ， 子 查询 返回 的 是 平均 工资 17000 英镑 。 注 意 ， 在 SELECT 列表 
中 使 用 了 标量 子 查询 ， 得 以 表示 与 平均 工资 的 差 。 外 查询 可 简写 如 下 : 


SELECT staffNo, fName, IName, position, salary - 17000 AS salDiff 
FROM Staff 
WHERE salary > 17000; 


查询 结果 如 表 6-20 所 示 。 « 
# 6-20 $6.20 的 查询 结果 表 


staffNo © Name salDiff 
S121 John 13000.00 
sG14 David 1000.00 


子 查询 应 遵循 如 下 规则 : 
(1) ORDER BY 子 句 不 能 用 于 子 查询 (虽然 可 用 在 最 外 面 的 SELECT 语句 中 )。 


(2) 子 查 询 SELECT 列表 必须 由 单个 列 名 或 表达 式 组 成 ， 除 非 子 查询 使 用 了 关键 词 
EXISTS (参见 6.3.8 节 )。 


(3) 默认 的 情况 下 ， 子 查询 中 列 名 取 自 子 查 询 的 FROM 子 句 中 给 出 的 表 ， 也 可 通过 限 
定 列 名 的 办 法 指定 取 自 外 查询 的 FORM 子 句 中 的 表 (参见 下 文 )。 

(4) 当 子 查询 是 比较 表达 式 中 的 一 个 操作 数 时 ， 子 查询 必须 出 现在 表达 式 的 右面 。 例 
如 ， 将 上 例 表达 成 下 面 形式 就 是 不 正确 的 : 


SELECT staffNo, fName, IName, position, salary 
FROM Staff 
WHERE (SELECT AVG(salary) FROM Staff) < salary; 


因为 子 查询 出 现在 了 与 salary 相 比 较 的 表达 式 的 左边 。 


| 例 6.21 D) REFRA: IN 的 使 用 
列 出 正 由 位 于 “163 Main St” 的 分 公司 的 员工 经 营 的 房产 。 
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SELECT propertyNo, street, city, postcode, type, rooms, rent 
FROM PropertyForRent 
WHERE staffNo IN (SELECT staffNo 
FROM Staff 
WHERE branchNo = (SELECT branchNo 
FROM Branch 
WHERE street = ‘163 Main St’)); 


最 里 面 的 查询 ， 首 先是 查询 位 于 “163 Main St” 的 分 公司 的 编号 ， 然 后 查询 工作 在 这 
个 分 公司 的 员工 。 这 时 ， 可 能 出 现 多 个 行 ， 所 以 最 外 面 查询 不 能 用 等 号 (=), mE IN% 
键 字 。 最 外 层 查询 出 中 间 层 得 到 的 员工 管理 的 房产 的 情况 。 

查询 结果 如 表 6-21 所 示 。 « 


R 6-21 例 6.21 的 查询 结果 表 


6.3.6 ANY 和 ALL 


关键 字 ANY 和 ALL 用 于 产生 单个 列 的 子 查 询 。 若 子 查询 前 级 关 键 字 ALL， 那 么 仅 当 
子 查询 产生 的 所 有 值 都 满足 条 件 时 ， 条 件 才 为 真 。 若 子 查询 前 组 关键 字 ANY, WATEK 
产生 的 任何 一 个 值 (一 个 或 多 个 ) 满足 条 件 时 ， 条 件 就 为 真 。 如 果子 查询 是 空 值 ，ALL 条 件 
返回 真 值 ，ANY 条 件 返回 假 值 。ISO 标准 允许 用 限定 词 SOME 代替 ANY. 


| 例 6.22 >> ANY/SOME 的 使 用 
列 出 工资 高 于 分 公司 B003 中 至 少 一 位 员工 的 工资 的 所 有 员工 。 
SELECT staffNo, fName, IName, position, salary 
FROM Staff 
WHERE salary > SOME (SELECT salary 
FROM Staff 
WHERE branchNo = ‘B003’); 
这 个 查询 中 ,首先 用 子 查询 找 出 工作 在 分 公司 B003 的 员工 的 最 低 工资 ， 然 后 ， 外 查询 
找 出 工资 高 于 这 个 数值 的 所 有 员工 (参见 例 6.20 )。 另 一 种 方法 是 使 用 关键 字 SOME/ANY。 
内 查询 产生 集合 {12000, 18000, 24000} ， 外 查询 找 出 工资 高 于 集合 中 任 一 个 数值 的 员工 〈 即 
为 大 于 最 小 值 12000 )。 这 种 方法 看 起 来 比 找 出 子 查询 中 的 最 少 工资 更 自然 一 些 。 查 询 结果 
如 表 6-22 所 示 。 《《 


表 6-22 例 6.22 的 查询 结果 表 


SL21 John 30000.00 
SG14 David 18000.00 
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| 例 6.23 >> ALL 的 使 用 
列 出 工资 高 于 分 公司 B003 中 任何 员工 的 工资 的 所 有 员工 。 
SELECT staffNo, fName, IName, position, salary 
FROM Staff 
WHERE salary > ALL (SELECT salary 
FROM Staff 
WHERE branchNo = ‘B003’); 
这 个 例子 和 上 一 个 例子 非常 相似 。 首 先 用 子 查 询 找 出 分 公司 B003 中 员工 工资 的 最 大 数 
值 ， 然 后 ， 外 查询 找 出 工资 高 于 这 个 数值 的 所 有 员工 。 在 这 个 例子 中 使 用 了 关键 字 ALL. 
查询 结果 如 表 6-23 所 示 。 « 


表 6-23 例 6.23 的 查询 结果 表 


6.3.7 多 表 查 询 


以 上 例子 的 一 个 最 大 问题 是 限定 查询 结果 中 出 现 的 所 有 列 必须 来 自 同一 个 表 。 很 多 情况 
F, 一 个 表 不 够 。 要 把 来 自 多 个 表 的 列 组 合 到 结果 表 时 ， 就 需要 用 到 连接 操作 。SQL 连接 操 
作 通 过 配对 相关 行 来 合并 两 个 表 中 的 信息 。 而 构成 连接 表 的 配对 行 是 指 这 两 行 在 两 个 表 的 匹 
配 列 上 具有 相同 的 值 。 

要 从 多 个 表 中 得 出 查询 结果 ， 可 用 子 查询 ， 也 可 用 连接 操作 。 如 果 最 终结 果 表 包括 了 多 
个 表 中 的 列 ， 则 必须 用 连接 操作 。 连 接 操作 中 ，FROM 子 句 列 出 多 个 表 名 ， 之 间 用 逗号 分 
开 。 通 常 还 要 用 WHERE 子 句 来 指明 连接 列 。 在 FROM 子 句 中 也 可 用 别名 代替 表 名 ， 它 们 
之 间 用 空格 分 开 。 别 名 可 在 列 名 有 歧义 的 时 候 用 来 指定 列 名 。 别 名 也 可 以 用 来 作为 表 名 的 简 
写 。 如 果 定 义 了 别名 ， 则 可 在 任何 地 方 用 它 代 替 表 名 。 


| 例 6.24 >> 简单 连接 
列 出 查看 过 房产 的 所 有 客户 的 姓名 及 其 所 提 的 意见 。 


SELECT c.clientNo, fName, IName, propertyNo, comment 
FROM Client c, Viewing v 
WHERE c.clientNo = v.clientNo; 


要 显示 来 自 表 Client AX Viewing 的 细节 信息 需要 用 到 连接 。SELECT 子 句 中 列 出 了 
需要 显示 的 列 。 注 意 ， 必 须 在 SELECT 列表 中 限定 员工 编号 clientNo: 由 于 clientNo 可 以 
来 自 两 个 表 中 任意 一 个 ， 所 以 必须 指定 来 自 哪 一 个 (选择 表 Viewing 中 的 员工 编号 clientNo 
也 可 以 )， 在 列 名 前 级 以 表 名 (或 别名 ) 即 可 实现 这 种 限定 。 此 例 中 ， 用 c 作为 表 Client 的 
别名 。 

为 得 到 所 需 的 行 ， 用 查询 条 件 〈c.clientNo=v.clientNo) 得 到 了 两 个 表 中 在 列 clientNo 上 
有 相同 值 的 那些 行 。 该 列 也 称 为 两 个 表 的 匹配 列 。 这 类 似 于 4.1.3 节 讨 论 的 关系 代数 的 相等 
连接 (Equijoin) 操作 。 查 询 结果 如 表 6-24 所 示 。 « 
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表 6-24 例 6.24 的 查询 结果 表 


CR76 Kay PG4 too remote 


最 普通 的 多 表 查 询 包 括 一 对 多 (1: *)( 或 父 / 子 ) 联系 的 两 个 表 (参见 12.6.2 节 )。 前 面 


涉及 client 和 viewing 关系 的 查询 就 是 这 样 的 例子 。 每 一 次 看 房 ( 子 ) 对 应 着 一 个 客户 〈 父 )， 
每 个 客户 ( 父 ) 可 能 多 次 去 看 房 ( 子 )， 产 生 的 查询 结果 中 的 行 对 是 父 / 子 行 的 结合 。 在 4.2.5 
节 曾 讨论 如 何 用 主 关 键 字 和 外 部 关键 字 建 立 关 系数 据 库 中 的 父 / 子 联系 。 主 关键 字 所 在 的 
表 是 父 表 ， 外 部 关键 字 所 在 的 表 是 子 表 。 要 在 SQL 查询 中 使 用 父 / 子 联系 ， 则 需要 指定 比 
较 主 关键 字 和 外 部 关键 字 的 查找 条 件 。 例 6.24 中 比较 表 Client 的 主 关键 字 c.clientNo 和 表 
Viewing 的 外 部 关键 字 v.clientNo。 


SQL 标准 提供 了 下 列 可 选择 的 方式 来 指定 连接 : 


FROM Client c JOIN Viewing v ON c.clientNo = v.clientNo 
FROM Client JOIN Viewing USING clientNo 
FROM Client NATURAL JOIN Viewing 


在 每 一 种 情况 中 ，FROM 子 句 都 替代 原来 的 FROM 和 WHERE 子 句 。 只 是 第 一 种 方式 


产生 的 表 中 有 两 个 clientNo 列 ， 而 其 他 两 种 方式 产生 的 表 中 只 有 一 个 clientNo 列 。 
| 例 6.25 D 排序 连接 结果 


对 每 一 个 分 公司 ， 列 出 管理 房产 的 员工 的 姓名 、 编 号 及 其 正在 管理 的 房产 。 


SELECT s.branchNo, s.staffNo, fName, IName, propertyNo 
FROM Staff s, PropertyForRent p 

WHERE s.staffNo = p.staffNo 

ORDER BY s.branchNo, s.staffNo, propertyNo; 


这 里 为 了 使 查询 结果 有 更 好 的 可 读 性 ， 按 分 公司 编号 作为 主 排序 关键 字 ， 员 工 编号 和 房 


产 编号 作为 次 关键 字 进 行 排序 。 查 询 结果 如 表 6-25 所 示 。 « 


6-25 例 6.25 的 查询 结果 表 


branchNo propertyNo 
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| 例 6.26 D) 三 表 连 接 

对 每 一 个 分 公司 ， 列 出 管理 房产 的 员工 的 姓名 、 编 号 ， 以 及 分 公司 所 在 的 城市 和 员工 管 
理 的 房产 。 

SELECT b.branchNo, b.city, s.staffNo, fName, IName, propertyNo 

FROM Branch b, Staff s, PropertyForRent p 

WHERE b.branchNo = s.branchNo AND s.staffNo = p.staffNo 

ORDER BY b.branchNo, s.staffNo, propertyNo; 

查询 结果 中 所 需 的 列 来 自 三 个 表 : Branch, Staff 和 PropertyForRent， 所 以 必须 用 连 
接 操 作 。 用 相等 条 件 (b.branchNo=s.branchNo) 连接 表 Branch 和 表 Staff， 将 每 个 分 公 
司 和 在 那里 工作 的 员工 连接 起 来 ， 用 相等 条 件 (s.staffNo=p.staffNo) 连接 表 Staff 和 表 
PropertyForRent， 将 每 位 员工 和 其 管理 的 房产 连接 起 来 。 查 询 结 果 如 表 6-26 所 示 。 « 


R 6-26 例 6.26 的 查询 结果 表 
B007 sn May PA 


YER, SQL 标准 为 FROM 和 WHERE 子 句 提供 可 选 的 表示 法 ， 例 如 : 


FROM (Branch b JOIN Staff s USING branchNo) AS bs 
JOIN PropertyForRent p USING staffNo 


| 例 6.27 » 按 多 个 列 分 组 
找 出 每 一 位 员工 管理 的 房产 的 数量 ， 以 及 该 员工 所 在 的 分 公司 编号 。 
SELECT s.branchNo, s.staffNo, COUNT(*) AS myCount 
FROM Staff s, PropertyForRent p 
WHERE s.staffNo = p.staffNo 


GROUP BY s.branchNo, s.staffNo 


ER BY s. No, s. : i 
ORDER BY s.branchNo, s.staffNo 表 6-27(a) 例 6.27 的 查询 结果 表 


为 列 出 所 需 的 数据 ， 首 先 找到 员工 管理 的 一 anN = ) 
房产 。 在 FORM/WHERE 子 句 中 ， 用 staftNo 列 一 一 一 y coun 


连接 表 Staff Al Z PropertyForRent, F—#, H 
GROUP BY 子 句 形成 按 分 公司 编号 和 员工 编号 的 
分 组 。 最 后 ， 用 GROUP BY 子 名 排序。 查询 结果 
如 表 6-27a 所 示 。 « 
连接 运算 的 计算 过 程 

连接 操作 其 实 是 更 一 般 的 两 表 合 并 ， 所 谓 笛 卡 儿 乘积 的 子 集 〈 参 见 5.1.2 市 )。 两 个 表 的 
笛 卡 儿 乘 积 是 包括 两 个 表 中 所 有 可 能 的 行 对 的 一 个 新 表 。 新 表 的 列 是 第 一 个 表 的 所 有 列 后 加 
上 第 二 个 表 的 所 有 列 。 如 果 两 个 表 的 查询 不 使 用 WHERE TA, WWA SQL 产生 的 查询 结果 
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就 是 两 个 表 的 笛 卡 儿 乘 积 。 事 实 上 ,ISO 标准 为 笛 卡 儿 乘 积 提 供 了 特殊 的 SELECT 语句 格式 : 


SELECT [DISTINCT | ALL] {* | columnList} 
FROM TableName1 CROSS JOIN TabieName2 


再 看 一 下 例 6.24， 用 匹配 列 clientNo 连接 表 Client 和 表 Viewing. 1 FAA 4-3 中 的 数 
据 ， 那 么 两 个 表 的 笛 卡 儿 乘 积 包括 20 行 (4 个 客户 X5$ 次 查看 = 20 行 )， 相 当 于 例 6.24 不 
用 WHERE 子 句 的 情况 。 

从 概念 上 看 ， 使 用 连接 的 SELECT 语句 查询 过 程 如 下 : 

(1) 形成 FROM 子 句 中 指定 表 的 笛 卡 儿 乘 积 。 

(2) 如 果 存 在 WHERE 子 句 ， 对 乘积 表 的 每 一 行 运用 查找 条 件 ， 保 留 那 些 满 足 条 件 的 
行 ， 用 关系 代数 术语 来 说 ， 这 个 操作 即 对 笛 卡 儿 乘 积 的 限制 。 

(3) 对 于 每 个 剩 下 的 行 ， 确 定 SELECT 列表 中 每 一 项 的 值 ， 并 形成 查询 结果 中 的 一 行 。 

(4) 如 果 指 定 了 SELECT DISTINCT， 则 消除 结果 中 重复 的 行 。 以 关系 代数 看 ,第 3 步 
和 第 4 步 相当 于 把 第 二 步 得 到 的 限制 在 SELECT 列表 列 上 进行 投影 。 

(5) 如 果 存 在 ORDER BY 子 句 ， 则 根据 要 求 对 查询 结果 进行 排序 。 

我 们 将 在 第 23 章 更 详细 地 讨论 查询 处 理 。 
外 连接 

连接 操作 通过 配对 相关 的 行 来 组 合 两 个 表 中 的 数据 ， 即 找 在 两 表 的 匹配 列 上 具有 相同 
值 的 行 。 如 果 表 中 某 一 行 不 匹配 男 一 表 的 任何 行 ， 那么 这 行将 从 结果 表 中 删除 。 这 就 是 上 
面 所 讨论 的 连接 问题 。ISO 标准 提供 的 另 一 类 连接 操作 称 为 外 连接 (参见 5.1.3 节 )。 外 连接 
保留 不 满足 连接 条 件 的 行 。 为 了 更 好 地 理解 外 连接 操作 ， 请 看 下 面 两 个 简化 的 表 Branch 和 
PropertyForRent， 分 别称 为 Branchl 和 PropertyForRent1l。 


Branch1 PropertyForRent1 
branchNo bCity propertyNo pCity 
B003 Glasgow PA14 Aberdeen 
B004 Bristol PL94 London 
B002 London PG4 Glasgow 


两 个 表 的 (内 ) 连接 如 下 : 


SELECT b.*, p.* 
FROM Branchi b, PropertyForRent1 p 
WHERE b.bCity = p.pCity; 


产生 的 结果 如 表 6-27b 所 示 。 
表 6-27(b) 表 Branch1 和 表 PropertyForRent1 内 连接 查询 结果 表 


branchNo bCity propertyNo pCity 


结果 表 输 出 两 个 表 中 相同 城市 的 所 有 行 。 特 别 注意 ， 没 有 行 与 Bristol 的 分 公司 匹配 ， 
也 没有 行 与 Aberdeen 的 房产 匹配 。 如 果 希 望 不 匹配 的 行 也 出 现在 结果 表 中 ， 就 需要 用 到 外 
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连接 。 外 连接 有 三 种 类 型 : 左 外 连接 、 右 外 连接 和 全 外 连接 。 下 面 的 例子 将 讲述 这 些 功 能 。 


| 例 6.28 >> 左 外 连接 

列 出 所 有 分 公司 以 及 与 其 处 于 同一 城市 的 房产 。 

这 两 个 表 的 左 外 连接 : 

SELECT b.*, p.* 

FROM Branch1 b LEFT JOIN PropertyForRent1 p ON b.bCity = p.pCity; 

产生 的 查询 结果 如 表 6-28 所 示 。 本 例 中 左 外 连接 不 仅 包括 了 那些 城市 列 值 相同 的 行 ， 
还 包括 了 第 一 个 (左边) 表 中 与 第 二 个 (右边) 表 无 匹配 行 的 那些 行 。 对 这 些 行 ， 来 自 第 二 
个 表 的 列 上 填 NULL, 


表 6-28 1 6.28 的 查询 结果 表 


« 
| 例 6.29 >> 右 外 连接 
列 出 所 有 房产 以 及 与 其 同 处 一 城 的 分 公司 。 
这 两 个 表 的 右 外 连接 : 
SELECT b.*, p.* 


FROM Branchi b RIGHT JOIN PropertyForRenti p ON b.bCity = p.pCity; 


产生 的 查询 结果 如 表 6-29 所 示 。 右 外 连接 不 仅 包括 了 相同 城市 列 值 的 行 ， 还 包括 了 第 
二 个 (右边 ) 表 中 与 第 一 个 (左边) 表 无 匹配 行 的 那些 行 。 对 这 些 行 ， 来 自 第 一 个 表 的 列 上 
填写 NULL。 


表 6-29 例 6.29 的 查询 结果 表 


« 
| 例 6.30 >> 全 外 连接 
列 出 处 于 同一 城市 的 分 公司 和 上 房产， 包括 不 匹配 的 分 公司 和 房产 。 
这 两 个 表 的 全 外 连接 : 
SELECT b.*, p.* 


FROM Branchi b FULL JOIN PropertyForRent1 p ON b.bCity = p.pCity; 


产生 的 查询 结果 如 表 6-30 所 示 。 全 外 连接 不 仅 包 括 具 有 相同 城市 列 值 的 行 ， 还 包括 两 
个 表 中 不 匹配 的 行 。 这 些 不 匹配 的 列 上 填写 NULL. 《< 
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R 6-30 例 6.30 的 查询 结果 表 


branchNo bCity propertyNo pCity 


NULL NUL PA14 Aberdeen 
B003 Glasgow PG4 Glasgow 
B004 Bristol NULL NULL 


B002 London PL94 London 


6.3.8 EXISTS 和 NOT EXISTS 


关键 字 EXISTS Al NOT EXISTS 仅 用 于 子 查 询 中 ， 返 回 结 果 为 真 / 假 。EXISTS AH 
当 且 仅 当 子 查询 返回 的 结果 表 至 少 存在 一 行 ， 当 子 查询 返回 的 结果 表 为 空 时 则 为 假 。NOT 
EXISTS 正 相 反 。 由 于 EXISTS 和 NOT EXISTS 仅 检 查 子 查询 结果 表 中 是 否 存 在 行 ， 所 以 子 
查询 可 查询 任意 数目 的 列 。 换 名 话说 说 ， 子 查询 通常 用 下 列 形 式 表示 : 


(SELECT * FROM . . .) 


| 例 6.31 >> 使 用 EXISTS 的 查询 
找 出 工作 在 伦敦 分 公司 的 所 有 员工 。 


SELECT staffNo, fName, IName, position 
FROM Staff s 
WHERE EXISTS (SELECT * 
FROM Branch b 
WHERE s.branchNo = b.branchNo AND city = “‘London’); 
查询 语句 可 改写 为 “ 找 出 所 有 这 样 的 员工 ， 其 分 公司 编号 为 branchNo， 对 应 表 Branch 
中 的 一 行 ， 并 且 该 分 公司 所 在 城市 为 伦敦 ”， 该 测试 就 是 测试 是 否 存在 这 样 一 行 。 如 果 存 在 ， 
子 查 询 为 真 。 查 询 结果 如 表 6-31 所 示 。 


R 6-31 例 6.31 的 查询 结果 表 


注意 ， 查 找 条 件 的 第 一 部 分 s.branchNo=b.branchNo 非常 必要 ， 可 以 确保 员工 属于 指 
定 的 分 公司 。 如 果 汤 掉 这 一 部 分 ， 则 将 会 列 出 所 有 的 员工 ， 因 为 子 查询 (SELECT * FROM 
Branch WHERE city='London') 总 是 为 真 ， 该 子 查询 将 简化 为 : 


SELECT staffNo, fName, IName, position FROM Staff WHERE true; 
等 价 于 

SELECT staffNo, fName, IName, position FROM Staff; 

也 可 用 连接 结构 重 写 这 个 查询 : 


SELECT staffNo, fName, IName, position 
FROM Staff s, Branch b 
WHERE s.branFchNo = b.branchNo AND city = ‘London’; «< 
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6.3.9 合并 结果 表 (UNION, INTERSECT 和 EXCEPT) 


SQL 中 ， 可 用 标准 的 并 、 交 和 差 集合 操作 将 多 个 查询 结果 表 合 并 成 一 个 查询 结果 表 : 

。 A 和 B 两 个 表 的 并 操作 是 一 个 包括 两 个 表 中 所 有 行 的 表 。 

© A 和 B 两 个 表 的 交 操 作 是 一 个 包括 两 个 表 中 共有 行 的 表 。 

。 A 和 B 两 个 表 的 差 操作 是 一 个 包括 那些 在 A 中 而 不 在 B 中 的 行 的 表 。 

集合 操作 如 图 6-1 所 示 ， 用 于 集合 操作 的 表 有 一 些 限 制 ， 最 重要 的 一 点 是 两 个 表 具 有 并 
相 容 性 ， 也 就 是 说 要 具有 相同 的 结构 。 即 两 个 表 必 须 包 含 相同 数目 的 列 ， 且 对 应 的 列 具 有 相 
同 的 数据 类 型 和 长 度 。 用 户 必须 确保 对 应 列 的 数值 来 自 相 同 的 域 。 例 如 ， 将 员工 年 龄 的 列 与 
房产 中 房间 数量 进行 组 合 是 不 明智 的 ， 尽 管 这 两 列 有 相同 的 数据 类 型 ， 例 如 SMALLINT, 





b) 交 
图 6-1 并 、 交 和 差 集合 操作 


ISO 标准 中 的 三 个 集合 运算 符 分 别 是 UNION、INTERSECT 和 EXCEPT， 集 合 操作 子 
名 格式 如 下 : 


operator [ALL] [CORRESPONDING [BY {columnt [, . . .}}] 
un R 48 % CORRESPONDING BY， 则 集合 操作 就 在 给 定 的 列 上 执行 ; 车 指定 


CORRESPONDING 而 没有 BY 子 句 ， 则 集合 操作 就 在 两 表 共 同 的 列 上 执行 。 奋 指定 ALL, 


则 查询 包括 一 切 重 复 的 行 。 一 些 SQL 的 实现 版 本 并 不 支持 INTERSECT H EXCEPT, WA 
一 些 实现 用 MINUS 取代 了 EXCEPT。 


| 例 6.32 >> UNION 的 使 用 
建立 有 分 公司 或 有 房产 的 所 有 城市 的 列表 。 


(SELECT city (SELECT * 

FROM Branch FROM Branch 

WHERE city IS NOT NULL) WHERE city IS NOT NULL) 
UNION 或 UNION CORRESPONDING BY city 
(SELECT city (SELECT * 

FROM PropertyForRent FROM PropertyForRent 

WHERE city IS NOT NULL); 


WHERE city Is NOT NULL); 


此 例 从 第 一 个 查询 中 产生 一 个 结果 表 ， 也 从 第 二 个 查 ES? 6 82 EEE 
LES ADR eee ee 
询 中 产生 一 个 结果 表 ， 然 后 将 两 个 表 合并 为 一 个 由 两 个 表 


London 
中 除去 所 有 重复 行 组 成 的 表 。 最 后 的 查询 结果 如 表 6-32 Glasgow, 
所 示 。 T Bristol 
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| 例 6.33 >> INTERSECT 的 使 用 
建立 既 有 分 公司 又 有 房产 的 所 有 城市 的 列表 。 


(SELECT city (SELECT * 
FROM Branch) FROM Branch) 
INTERSECT 或 INTERSECT CORRESPONDING BY city 

(SELECT city (SELECT * 

FROM PropertyForRent); FROM PropertyForRent); 

此 例 从 第 一 个 查询 中 产生 一 个 结果 表 ， 也 从 第 二 个 ” 表 6-33 例 6.33 的 查询 结果 表 
查询 中 产生 一 个 结果 表 ， 然 后 将 两 个 表 合并 为 一 个 由 两 ov 
个 表 所 有 共有 行 组 成 的 表 。 最 后 的 查询 结果 如 表 6-33 Aberdeen 
所 示 。 Glasgow 

可 以 不 用 INTERSECT 运算 符 重 写 这 个 查询 ， 例 如 : London 

SELECT DISTINCT b.city SELECT DISTINCT city 

FROM Branch b, PropertyForRent p FROM Branch b 

WHERE b.city = p.city; 或 WHERE EXISTS (SELECT * 


FROM PropertyForRent p 
WHERE b.city = p.city); 


可 用 各 种 等 价 的 形式 书写 查询 是 SQL 语言 的 一 大 缺陷 。 « 
| 例 6.34 >> EXCEPT 的 使 用 
建立 具有 分 公司 但 没有 房产 的 所 有 城市 的 列表 。 


(SELECT city (SELECT * 

FROM Branch) FROM Branch) 

EXCEPT 或 EXCEPT CORRESPONDING BY city 
(SELECT city (SELECT * 

FROM PropertyForRent); FROM PropertyForRent); 


查询 从 第 一 个 查询 中 产生 一 个 结果 表 ， 也 从 第 二 个 查 

询 中 产生 一 个 结果 表 ， 然 后 将 两 个 表 合并 为 一 个 由 在 第 一 

表 中 而 不 在 第 二 表 中 的 所 有 行 组 成 的 表 。 最 后 的 查询 结果 wok 

如 表 6-34 所 示 。 = 
可 以 不 用 EXCEPT 运算 符 重 写 这 个 查询 。 例 如 


R 6-34 例 6.34 的 查询 结果 表 


SELECT DISTINCT city SELECT DISTINCT city 
FROM Branch FROM Branch b 
WHERE city NOT IN (SELECT city = WHERE NOT EXISTS 
FROM PropertyForRent); (SELECT * 
FROM PropertyForRent p 
WHERE b.city = p.city); < 
6.3.10 ”数据 库 更 新 


SQL 是 一 种 完全 的 数据 操作 语言 ， 可 用 于 修改 数据 库 中 的 数据 ， 也 可 用 于 查询 数据 库 。 
修改 数据 库 的 命令 不 像 SELECT 语句 那样 复杂 。 本 节 讨 论 修改 数据 库 内 容 的 三 种 SQL 语句 。 

e INSERT: 回 表 中 添加 新 的 行 。 

èe UPDATE: 修改 表 中 现 有 的 行 。 

e DELETE: 删除 表 中 已 有 的 行 。 
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问 数据 库 中 添加 数据 (INSERT ) 


这 里 有 两 种 INSERT 语句 形式 ,第 一 种 是 插入 一 个 行 的 语句 ， 格 式 如 下 : 
INSERT INTO TableName [(columnList)] 
VALUES (dataValueList) 


TableName 是 一 个 基 表 或 是 一 个 可 更 新 的 视图 (参见 7.4 4), columnList 代表 用 逗号 分 
开 的 一 个 或 多 个 列 名 ， 该 项 是 可 选 的 。 如 果 省 略 columnList，SQL 将 严格 按 它们 在 CREATE 
columnList 有 如 下 匹配 : 


TABLE 命令 中 的 序 。 如 果 给 出 columnList， 则 在 columnList 中 未 出 现 的 列 在 建 表 时 不 能 声 
明 为 NOT NULL， 除 非 建 该 列 时 使 用 DEFAULT 选项 (参见 7.3.2 节 )。dataValueList 必须 与 


e 人 列表 columnList 与 dataValueList 中 项 的 数目 必须 是 相同 的 。 


中 的 第 一 项 。dataValueList 中 的 第 二 项 对 应 于 columnList 中 的 第 二 项 ， 等 等 。 
| 例 6.35 >») INSERT...VALUES 


e 两 个 列表 中 项 的 位 置 必须 是 直接 对 应 的 ，dataValueList 中 的 第 一 项 对 应 于 columnList 
INSERT INTO Staff 


© dataValueList 列表 中 每 一 项 的 数据 类 型 必须 和 对 应 列 数据 类 型 兼容 。 
向 表 Staff 中 插入 包括 所 有 列 数据 的 一 个 新 行 。 


VALUES (‘SG16’, ‘Alan’, ‘Brown’, ‘Assistant’, ‘M’, DATE ‘1957-05-25’, 8300, ‘B003’); 

本 例 按照 表 创 建 时 的 列 顺序 插入 数据 ， 不 必 再 指定 列 名 列表 。 注 意 ，Alan 这 样 的 字符 
常量 必须 用 单 引 号 引起 来 。 

| 例 6.36 >» 默认 插入 方式 


<4 
INSERT INTO Staff (staffNo, fName, IName, position, salary, branchNo) 


$a tei A BE BEE, WU aE A BOS FH. UA ASIF A EE, {8 
是 按 它 们 在 表 中 原本 出 现 的 顺序 是 比较 常见 的 做 法 。 也 可 以 把 INSERT 语句 写成 下 面 形式 : 
INSERT INTO Staff 


指定 列 staffNo, fName, Iname, position, salary 和 branchNo, HÆ Staff 中 插入 新 行 。 
VALUES (‘SG44’, ‘Anne’, ‘Jones’, ‘Assistant’, 8100, ‘B003’); 
本 例 中 显 式 地 指定 sex 和 DOB 应 设置 为 NULL。 


VALUES (SG44, ‘Anne’, ‘Jones’, ‘Assistant’, NULL, NULL, 8100, “B003’); 
SELECT... 


第 二 种 INSERT 语句 允许 把 一 个 或 多 个 表 中 的 多 个 行 复制 到 另 一 个 表 ， 格 式 如 下 : 
INSERT INTO TableName [(columnList)] 


INSERT 语句 的 约束 在 这 里 也 有 效 。 


插入 单个 行 之 前 ，TableName 和 columnList 必须 预先 定义 好 ，SELECT 子 句 可 以 是 任何 
有 效 的 语句 。 插 人 给 定 表 中 的 行 就 是 来 自 于 子 查询 所 生成 的 查询 结果 表 。 用 于 第 一 种 形式 的 
| 例 6.37 >>» INSERT...SELECT 


假设 表 StaffPropCount 中 包含 员工 的 名 字 及 他 所 管理 的 房产 的 数目 。 
StaffPropCount(staffNo, fName, IName, propCount) 


€ 
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用 表 Staff 和 表 PropertyForRent 中 的 数据 产生 表 StaffPropCount. 


INSERT INTO StaffPropCount 

(SELECT s.staffNo, fName, IName, COUNT(*) 

FROM Staff s, PropertyForRent p 

WHERE s.staffNo = p.staffNo 

GROUP BY s:.staffNo, fName, IName) 

UNION 

(SELECT staffNo, fName, IName, 0 

FROM Staff s 

WHERE NOT EXISTS (SELECT * 
FROM PropertyForRent p 
WHERE p.staffNo = s.staffNo)); 


因为 需要 计算 出 员工 管理 的 房产 的 数目 ， 所 以 例子 变 得 更 加 复杂 。 如 果 省 略 UNION 的 
第 二 部 分 ， 则 得 到 的 是 至 少 管理 一 处 房产 的 员工 的 列表 。 换 名 话说， 就 是 把 没有 管理 过 房 
产 的 员工 排除 掉 了 。 所 以 ， 为 了 包括 没有 管理 房产 的 员工 ， 必 须 用 UNION 语句 和 第 二 个 
SELECT 语句 增加 这 样 的 员工 ， 计 数 属性 设 为 0 值 。 表 StaffPropCount 如 表 6-35 所 示 。 


表 6-35 例 6.35 的 查询 结果 表 


注意 ， 一 些 SQL 的 实现 版 本 不 允许 在 INSERT 子 查询 中 使 用 UNION 运算 符 。 
修改 数据 库 中 的 数据 (UPDATE) 
UPDATE 语句 允许 改变 给 定 表 中 已 存在 的 行 的 内 容 。 命 令 格式 如 下 : 


UPDATE TableName 
SET columnName1 = dataValuel [, columnName2 = dataValue2 ...] 
[WHERE searchCondition] 


TableName 是 基 表 或 可 更 新 视图 的 名 字 (参见 7.4 节 )。SET 子 句 指定 需要 更 新 的 一 个 或 
多 个 列 的 名 字 。WHERE 子 句 是 可 选择 的 ， 如 果 省 略 ， 则 对 给 定 列 的 所 有 行进 行 更 新 。 如 果 
给 出 WHERE 子 句 ， 则 仅 对 那些 满足 searchCondition 的 行进 行 更 新 ， 新 的 dataValue 必须 与 
对 应 列 中 的 数据 类 型 兼容 。 
| 例 6.38 >> 更 新 所 有 行 

把 所 有 员工 的 工资 提高 3%。 

UPDATE Staff 

SET salary = salary*1.03; 


这 个 更 新 是 对 表 中 所 有 行 的 ， 故 WHERE 子 句 可 省 上 略 。 « 
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| 例 6.39 >> 更 新 指定 的 行 
把 所 有 经 理 的 工资 提高 5%。 


UPDATE Staff 
SET salary = salary*1.05 
WHERE position = ‘Manager’; 


WHERE 子 句 找 出 所 有 经 理 的 行 ， 然 后 把 更 新 salary=salary*1.05 应 用 到 特定 的 行 。 & 


| 例 6.40 >> 更 新 多 个 列 
提升 David Ford (staffNo= ‘SG14’) 为 经 理 ， 工 资 变 为 18000 英镑 。 


UPDATE Staff 
SET position = ‘Manager’, salary = 18000 
WHERE staffNo = ‘SG14’; «<< 


删除 数据 库 中 的 数据 (DELETE) 

DELETE 语句 允许 从 给 定 表 中 删除 行 。 命 令 格式 如 下 : 

DELETE FROM TableName 

[WHERE searchCondition] 

与 INSERT 和 UPDATE 语句 一 样 ，TableName 是 基 表 或 可 更 新 的 视图 的 名 字 (参见 7.4 
节 )。searchCondition 是 可 选择 的 ， 如 果 省 略 ， 则 所 有 行 都 会 被 删除 。 注 意 ， 不 是 删除 表 本 
身 ， 而 是 删除 表 的 内 容 。 若 要 既 删 内 容 又 删 表 定义 ， 可 用 DROP TABLE 语句 (参见 7.3.3 
节 )。 如 果 指 定 了 searchCondition， 则 仅 删 除 那些 满足 条 件 的 行 。 


| 例 6.41 >> 删除 指定 行 
删除 所 有 与 房产 PG4 有 关 的 行 。 


DELETE FROM Viewing 
WHERE propertyNo = ‘PG4’; 


WHERE 子 句 找 出 房产 编号 为 PG4 的 所 有 行 ， 删 除 这 些 行 。 « 


| Bi 6.42 >> 删除 所 有 行 
从 表 Viewing 中 删除 所 有 行 。 
DELETE FROM Viewing; 


不 给 出 WHERE 子 句 ， 将 会 删 去 表 中 所 有 行 ， 只 留 下 表 的 定义 ， 这 样 做 的 目的 是 使 稍 后 
仍 可 插入 数据 。 « 


本 章 小 结 

© SQL 是 非 过 程 性 语言 ， 由 标准 的 英语 单词 SELECT, INSERT 和 DELETE 等 组 成 ,专业 和 非 专 业 人 
员 都 可 同样 使 用 该 语言 。 它 是 定义 和 操作 关系 数据 库 形式 上 和 事实 上 的 标准 语言 。 

e SELECT 是 SQL 语言 中 最 重要 的 语句 ， 用 于 数据 查询 。 它 组 合 了 三 种 基本 的 关系 代数 操作 : 选择 、 
投影 和 连接 。 每 个 SELECT 语句 产生 一 个 包括 一 个 或 多 个 列 、 零 个 或 多 个 行 的 查询 结果 表 。 

è SELECT 子 句 标 出 将 在 查询 结果 表 中 出 现 的 列 和 计算 数据 。SELECT 子 句 中 出 现 的 每 个 列 必须 出 自 
FROM 子 句 列 出 的 某 个 表 或 视图 。 


OF SQL: KERE 137 


WHERE 子 句 将 查询 条 件 应 用 到 给 定 表 以 查找 满足 条 件 的 行 。ORDER BY 子 句 允许 根据 查询 结果 表 
中 一 个 或 多 个 列 的 值 对 行 排序 ， 每 列 可 按 升序 或 降序 排序 。 如 果 给 出 ORDER BY 子 句 ， 则 其 必须 
为 SELECT 语句 的 最 后 一 个 子 句 。 

SQL 支持 五 种 聚集 函数 (COUNT, SUM, AVG, MIN 和 MAX)， 输 入 一 个 完整 的 列 作为 参数 ， 并 
计算 出 单个 值 。 在 SELECT 子 句 中 混合 使 用 聚集 函数 和 列 名 是 非法 的 ， 除 非 使 用 了 GROUP BY 
THE 

GROUP BY 子 句 允许 在 查询 结果 表 中 包含 汇总 信息 。 一 个 或 多 个 列 上 有 相同 值 的 行 分 为 一 组 。 
这 时 ， 聚 集 函 数 把 每 一 组 作为 参数 ， 计 算出 每 组 中 的 一 个 值 。HAVING 子 句 相当 于 用 于 组 上 的 
WHERE 子 句 ， 限 制 了 出 现在 最 后 结果 表 中 的 分 组 。 然 而 ， 与 WHERE 子 句 不 同 的 是 ，HAVING 子 
句 可 以 包括 聚集 函数 。 

子 查询 是 指 一 个 SELECT 语句 完全 艇 套 到 另 一 个 查询 中 ， 出 现在 WHERE Al HAVING FAP, X 
称 为 子 查询 或 骨 套 查询 。 理 论 上 ， 子 查询 产生 一 个 临时 的 结果 表 用 于 外 查询 访问 .= 一 个 子 查 询 可 以 
内 套 到 另 一 个 子 查询 中 。 

子 查询 有 三 种 类 型 : 标量 、 行 和 表 。 标 量子 查询 返回 单行 、 单 列 ， 即 单个 值 。 原 则 上 ， 标 量子 查询 
可 用 于 仅 需 一 个 值 的 地 方 。 行 子 查 询 用 于 仅 需 一 个 行 值 构造 器 的 地 方 ， 典 型 情况 是 在 谓词 中 。 表 碍 
询 返 回 多 列 、 多 行 。 表 查询 用 于 需要 一 个 表 的 情况 ， 例 如 作为 IN 谓词 的 操作 数 。 

如 果 结 果 表 中 的 列 来 自 多 个 表 ， 则 必须 用 到 连接 操作 ， 通 常 可 在 FROM 子 句 中 指定 连接 表 ， 在 
WHERE 子 句 指定 连接 列 。ISO 标 准 中 允许 定义 外 连接 :也 允许 用 UNION、INTERSECT 和 
EXCEPT 命令 进行 集合 并 、 交 和 差 操作 。 

除 SELECT 外 ，SQL DML 还 包括 : 向 某 具 名 表 插 入 单个 行 的 INSERT 语句 和 向 表 中 插入 来 自 某 子 
查询 的 任意 多 行 的 子 查询 语句 ; 更 新 某 具 名 表 中 的 一 个 指定 列 或 多 个 列 的 值 的 UPDATE 语句 ; 删 
除 某 具 名 表 中 一 个 或 多 个 行 的 DELETE 语句 。 


思考 题 


6.1 
6.2 
6.3 
6.4 
6.5 
6.6 
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SQL 的 两 个 主要 组 成 部 分 及 其 功能 分 别 是 什么 ? 

SQL 语言 的 优点 和 缺点 是 什么 ? 

解释 SELECT 语句 中 每 个 子 句 的 功能 。 这 些 子 句 在 应 用 时 有 哪些 限制 ? 

SELECT 语句 中 ,聚集 函 数 在 使 用 时 运用 的 限制 条 件 是 什么 ” 空 值 对 限 集 函数 有 什么 影响 ? 
解释 GROUP BY 子 句 是 如 何 工作 的 。WHERE 和 HAVING 子 句 的 区 别 是 什么 ? 

子 查询 和 连接 操作 的 差别 是 什么 ?什么 环境 下 不 能 使 用 子 查询 ? 


习题 6.7 一 习题 6.28 使 用 第 4 章 习题 开始 部 分 定义 的 Hotel 关系 数据 库 模 式 。 
简单 查询 


6.7 
6.8 
6.9 
6.1 
6.1 


列 出 所 有 酒店 的 情况 。 

列 出 伦敦 所 有 酒店 的 情况 。 

列 出 住 在 伦敦 的 所 有 客人 的 姓名 和 地 址 ， 按 字母 表 顺 序 排 序 。 
0 列 出 每 晚 房价 在 40 英镑 以 下 的 所 有 双人 间或 套间 ， 按 价格 升序 排序 。 
1 列 出 没有 指定 dateTo 的 预订 情况 。 
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聚集 函数 

6.12 ”有 多 少 酒店 ? 

6.13 ”房间 的 平均 价格 是 多 少 ? 

6.14 所 有 双人 间 每 晚 的 总 收入 是 多 少 ? 

6.15 八 月 份 有 多 少 不 同 的 客人 订房 ? 

子 查询 和 连接 操作 

6.16 列 出 格 罗 夫 纳 酒店 所 有 房间 的 价格 和 类 型 。 

6.17 列 出 当前 住 在 格 罗 夫 纳 酒店 的 所 有 客人 的 情况 。 

6.18 列 出 格 罗 夫 纳 酒店 所 有 房间 的 情况 ， 包括 房间 中 住 的 客人 的 名 字 。 

6.19 ”今天 格 罗 夫 纳 酒店 订房 的 总 收入 是 多 少 ? 

6.20 列 出 格 罗 夫 纳 酒店 当前 没 被 使 用 的 房间 。 

6.21 格 罗 夫 纳 酒店 空房 损失 是 多 少 ? 

分 组 

6.22， 列 出 每 个 酒店 的 房间 数量 。 

6.23 列 出 伦敦 每 个 酒店 的 房间 数量 。 

6.24 八 月 份 每 个 酒店 平均 订房 数 是 多 少 ? 

6.25 ”伦敦 每 个 酒店 最 常 订 的 房间 类 型 是 什么 ? 

6.26 今天 每 个 酒店 空房 损失 是 多 少 ? 

- 修改 表 

6.27 问 每 一 个 表 中 插 人 一 行 。 

6.28” 所 有 房间 的 价格 提高 5%. 

综合 

6.29 研究 当前 使 用 的 各 种 DBMS 中 的 SQL 方言 。 查 看 系统 是 否 符合 ISO 标准 中 的 DML 语句 。 研 究 
DBMS 的 扩展 功能 。 是 否 有 SQL 标准 中 不 支持 的 功能 ? 

6.30 说明 任何 用 HAVING 子 句 的 查询 语句 都 存在 一 个 等 价 的 不 用 HAVING 子 句 的 查询 语句 。 

6.31 说 明 SQL 是 具有 关系 完整 性 的 查询 语言 。 

案例 2 

习题 6.32 ~ 习题 6.40 使 用 第 5 章 后 面 的 习题 定义 的 项 目 (Project) RA. 

6.32 ” 按 姓氏 字典 序列 出 所 有 雇员 的 姓名 。 

6.33 列 出 所 有 女 雇 员 的 情况 。 

6.34 列 出 所 有 担任 经 理 的 雇员 的 名 字 和 地 址 。 

6.35 产生 所 有 为 IT 部 门 工 作 的 雇员 的 名 字 和 地 址 表 。 

6.36 产生 今年 内 退休 的 所 有 经 理 的 全 部 情况 表 ， 并 按 姓 氏 字典 序 排 列 。 

6.37 找 出 有 多 少 雇员 由 James Adams 管理 。 

6.38 产生 每 位 雇员 工作 总 时 数 的 报表 ， 按 部 门 编号 排序 ， 同 一 部 门 内 按 雇员 的 姓氏 字典 序 排 列 。 

6.39 ” 找 出 多 于 两 位 雇员 参与 工作 的 项 目 ， 列 出 项 目 编号 、 项 目 名 称 和 参与 该 项 目的 雇员 人 数 。 

6.40 列 出 雇员 数 多 于 10 人 的 那些 部 门 的 雇员 总 数 ， 为 结果 关系 各 列 创建 合适 的 列 名 。 

案例 3 

习题 6.41 ~ 习题 6.54 使 用 第 5 章 后 面 的 习题 定义 的 图 书馆 (Library) 模式 。 

6.41 列 出 所 有 书目 。 


6.42 
6.43 
6.44 
6.45 
6.46 
6.47 
6.48 
6.49 
6.50 
6.51 
6.52 
6.53 
6.54 
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列 出 所 有 读者 的 情况 。 

列 出 所 有 2012 年 出 版 的 书目 。 

列 出 所 有 书目 可 外 借 的 副本 。 

列 出 《指环 王 》 所 有 可 外 借 的 副本 。 

列 出 目前 正 借阅 《指环 王 》 的 读者 的 姓名 。 

列 出 有 和 逾期 未 还 图 书 的 读者 的 姓名 。 

ISBN 为 “0-321-52306-7” 的 书 有 多 少 本 ? 

ISBN 为 “0-321-52306-7” 的 书 还 有 和 多少 本 可 外 借 ? 
ISBN 为 “0-321-52306-7” 的 书目 借 出 过 多 少 次 ? 
产生 由 Peter Bloomfield 借阅 的 图 书 的 书目 表 。 

对 馆藏 多 于 三 个 副本 的 书目 ， 列 出 借阅 过 它 的 读者 的 姓名 。 
产生 当前 借 有 图 书 逾 期 未 还 的 读者 的 情况 报表 。 
产生 每 个 书目 被 借阅 总 次 数 的 报表 。 
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本 章 我 们 主要 学 习 : 
e SQL 标准 支持 的 数据 类 型 
© SQL 完整 性 增强 特性 的 用 途 
o 如 何 使 用 SQL 定义 下 列 完整 性 约束 
m 必须 有 值 的 数据 
mw 域 约束 
m 实体 完整 性 
加 引用 完整 性 
加 一 般 性 约束 
在 CREATE 和 ALTER TABLE 语句 中 如 何 使 用 完整 性 增强 特性 
视图 的 用 途 
如 何 使 用 SQL 创建 和 删除 视图 
DBMS 如 何在 视图 上 完成 操作 
视图 在 什么 条 件 下 是 可 更 新 的 
视图 的 优点 和 缺点 
ISO 事务 模型 的 运行 机 制 
如 何 使 用 GRANT 和 REVOKE 语句 构成 一 级 安全 


上 一 章 中 讨论 了 结构 化 查询 语言 ( SQL) 的 某 些 细节 ， 具 体 而 言 就 是 数据 操作 特性 。 本 
章 继 续 讲述 SQL， 主 要 分 析 SQL 的 数据 定义 功能 。 


7.1 节 讲 述 ISO SQL 的 数据 类 型 。1989 , ISO 标准 引入 完整 性 增强 特性 (Integrity 
Enhancement Feature，IEF)， 提 供 了 定义 引用 完整 性 和 其 他 约束 的 功能 (ISO，1989 )。 在 
该 标准 制定 之 前 ， 确 保 满 足 约 束 条 件 是 每 个 应 用 程序 的 责任 。IEF 规定 的 提出 极 大 地 增强 
了 SQL 的 功能 ， 并 能 集中 、 规 范 地 完成 约束 检查 。7.2 节 讲 述 完整 性 增强 特性 ，7.3 节 讲 述 
SQL 的 主要 数据 定义 功能 。 

7.4 节 讲 述 如 何 用 SQL 创建 视图 ， 以 及 DBMS 如 何 将 视图 操作 转换 为 等 价 的 对 基 表 的 
操作 ， 并 讨论 ISO SQL 标准 对 可 更 新 视图 的 约束 。7.5 节 简单 描述 ISO SQL 的 事务 模型 。 

视图 提供 一 定 程度 的 数据 库 安全 性 。SQL 也 提供 独立 的 访问 控制 子 系统 ， 人 允许 用 户 共享 
数据 库 对 象 ， 或 限制 对 数据 库 对 象 的 访问 。7.6 节 讲 述 访问 控制 子 系统 。 

第 9 章 将 讲述 最 近 添 加 到 SQL 规范 中 的 有 关 面 向 对 象 数 据 管理 的 一 些 特 性 。 附 录 工 讨 
论 如 何 将 SQL 嵌入 高 级 编程 语言 ， 以 便 能 使 用 那些 目前 还 不 能 在 SQL 中 直接 使 用 的 结构 。 
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和 前 面 章节 一 样 ， 本 章 使 用 DreamHome 案例 表述 SQL 的 特性 ， 并 采用 与 6.2 节 所 定义 的 
SQL 语句 相同 的 格式 标记 。 


7.1 ISO SQL 数据 类 型 
本 节 介 绍 SQL 标准 定义 的 数据 类 型 ， 首 先 定 义 合 法 的 标识 符 。 


7.1.1 SQL 标识 条 


SQL 标识 符 用 于 标识 数据 库 中 的 对 象 ， 如 表 名 字 、 视 图 名 和 列 。 用 户 目 定义 的 SQL 标 
识 符 中 的 所 用 字符 必须 是 字符 集中 存在 的 。ISO 提供 默认 的 字符 集 ， 包 括 大 写字 母 A 到 Z、 
小 写字 母 a 到 z、 数 字 0 到 9 和 下 划 线 (_) 字符 。 也 可 以 指定 另外 的 字符 集 。 标 识 符 有 下 列 
限制 : 

e 标识 符 不 能 长 于 128 个 字符 〈 大 多 数 方言 限制 更 短 ) 。 

e 标识 符 必 须 以 字母 开头 。 

e 标识 符 中 不 能 有 空格 。 


7.1.2 SQL 标量 数据 类 型 


K 7-1 给 出 了 ISO 标准 定义 的 SQL 标量 数据 类 型 。 为 了 操作 和 转换 方便 ， 有 时 把 字符 
和 位 数据 类 型 合 称 为 字符 串 数据 类 型 ， 定 点 数 和 浮 点 数 合 称 为 数值 数据 类 型 ， 因 为 它们 有 相 
同 的 特征 。SQL 标准 目前 又 定义 了 字符 大 对 象 和 二 进 制 大 对 象 ， 这 些 将 在 第 9 章 中 讨论 。 
表 7-1 ISO SQL 数据 类 型 
数据 类 型 E B 


布尔 型 BOOLEAN 

字符 型 CHAR, VARCHAR 

位 类 型 ” BIT, BIT VARYING 

定点 数 型 NUMERIC, DECIMAL, INTEGER, SMALLINT, BIGINT 
浮 点 数 型 FLOAT, REAL, DOUBLE PRECISION 


日 期 时 间 型 DATE, TIME, TIMESTAMP 

间隔 型 INTERVAL 

大 对 象 型 CHARACTER LARGE OBJECT, BINARY LARGE OBJECT 
(D BIT 和 BIT VARYING 现 已 从 SQL:2003 标准 中 删除 。 


布尔 型 数据 

布尔 型 数据 包括 不 同 的 真 值 TRUE # FALSE, RIEA NOT NULL 约束 的 限制 ， 否 则 一 
个 布尔 型 数据 也 可 把 UNKNOWN 的 真 值 设 为 NULL 值 。 所 有 布尔 型 数据 的 值 和 SQL 真 值 . 
都 可 以 相互 比较 和 赋值 。 真 值 TRUE 大 于 真 值 FALSE， 且 任何 涉及 NULL 或 UNKNOWN 
真 值 的 比较 ， 返 回 的 结果 亦 为 UNKNOWN, 
字符 型 数据 

字符 型 数据 是 由 实现 确定 的 字符 集 给 出 的 字符 序列 ， 也 就 是 说 ， 它 由 一 个 SQL 方言 供 
应 商定 义 。 因 此 ， 字 符 类 型 的 列 中 究竟 允许 出 现 哪些 字符 数据 是 随 供 应 商 的 定义 而 不 同 的 。 
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ASCII 和 EBCDIC 是 现在 最 和 常用 的 两 个 字符 集 。 设 定 字 符 数 据 类 型 的 格式 如 下 : 
CHARACTER [VARYING] [length] 
CHARACTER ® %5 # CHAR 
CHARACTER VARYING | 5 4 VARCHAR 
定义 一 个 字符 串 列 时 ， 可 以 指定 列 可 容纳 的 字符 串 的 最 大 长 度 (默认 长 度 为 1)。 字 
和 从 串 长 度 可 以 是 固定 或 变化 的 。 当 字符 串 定义 为 固定 长 度 时 ， 硅 输入 字符 串 小 于 这 个 长 
度 ， 则 字符 串 右 边 将 用 空格 补足 所 需 的 大 小 。 当 字符 串 定义 为 变 长 的 ， 帮 输入 字符 串 小 于 
最 大 长 度 ， 则 只 存储 输入 的 那些 字符 ， 因 此 节省 了 空间 。 例 如 表 Branch 中 分 公司 编号 列 
branchNo, 长 度 固 定 为 四 个 字符 ,定义 如 下 : 


branchNo CHAR(4) 


K PrivateOwner 中 address 列 为 可 变 长 字符 串 ， 长度 最 大 为 30， 声 明 如 下 : 
address VARCHAR(30) 


位 类 型 数据 

位 类 型 用 于 定义 位 字符 串 ， 即 二 进 制 数字 (位 ) 序列 ， 每 一 个 值 为 0 或 1。 定义 位 类 型 
的 格式 和 定义 字符 串 类 型 是 类 似 的 : 

BIT [VARYING] [length] 


例如 ， 对 于 固定 长 度 二 进 制 串 “0011”， 可 声明 列 bitString 为 : 
bitString BIT(4) 


定点 数 型 数据 

定点 数据 类 型 用 于 定义 准确 表示 的 数值 。 数 值 包括 数字 、 可 选 的 小 数 点 和 可 选 的 正 负 
号 ， 数 据 类 型 包括 精度 (precision) 和 小 数位 数 (scale)。 精 度 表 示 数 的 全 部 位 数 ， 就 是 全 部 
数字 的 位 数 ， 包 括 除 小 数 点 外 的 小 数 部 分 的 位 数 。 小 数位 数 表示 小 数 部 分 的 全 部 位 数 。 例 
如 ， 定 点 数 -12.345， 精 度 为 5S， 小 数位 数 为 3。 整数 是 特殊 的 定点 数 。 说 明定 点 数据 类 型 
有 以 下 几 种 方式 : 

NUMERIC | precision [, scale] ] 

DECIMAL [ precision [, scale] ] 

INTEGER 

SMALLINT 


BIGINT 
INTEGER ® {3 HINT , DECIMAL 可 简写 为 DEC 


NUMERIC 和 DECIMAL 用 于 表示 十 进 制 数 ， 默 认 小 数位 数 为 0， 默认 精度 依赖 于 具体 
实现 。INTEGER 用 于 较 大 的 正 负 整 数 。SMALLINT 用 于 较 小 的 正 负 整 数 ，BIGINT 用 于 非 
稼 大 的 正 负 整 数 。 通 过 指定 数据 类 型 ， 可 以 节省 数据 存储 空间 。 例 如 ，SMALLINT 类 型 能 
存储 绝对 值 最 大 为 32 767 的 整数 。 表 PropertyForRent 中 的 列 rooms 表示 一 处 房屋 中 房间 的 
数目 ， 明 显 是 个 小 整数 ， 因 此 能 定义 为 : 

rooms SMALLINT 

表 Staff 中 的 列 salary 可 声明 为 : 

salary DECIMAL(7,2) 
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它 的 值 最 大 可 达 99 999.99, 
浮 点 数 型 数据 

浮 点 数据 类 型 用 于 定义 非 精 确 数字 ， 比 如 实数 。 浮 点 数 或 近似 数 类 似 于 科学 表示 法 ， 将 
一 个 数 写 为 尾数 乘 以 10 REV (4840), 例如 10E3、 十 5.2E6、 一 0.2E 一 4。 近 似 数值 类 型 有 
以 下 几 种 说 明 方 式 : 


FLOAT [precision] 
REAL 
DOUBLE PRECISION 


其 中 ， 精 度 决 定 了 尾数 的 精度 。REAL 和 DOUBLE PRECISION 的 精度 依赖 于 具体 实现 。 
日 期 时 间 型 数据 

日 期 时 间 类 型 用 于 定义 一 定 精度 的 时 间 点 ， 比 如 日 期 、 时 间 和 一 天 中 的 时 间 。ISO 标准 
iE A HREN A YEAR, MONTH, DAY, HOUR, MINUTE, SECOND, 、TIMEZONE 
HOUR 和 TIMEZONE_ MINUTE。 后 面 两 个 字段 指定 从 国际 标准 时 间 〈 格 林 尼 治标 准时 间 ) 
的 时 区 偏 移 的 小 时 和 分 钟 数 。 支 持 三 种 日 期 时 间 类 型 . 

DATE 

TIME [timePrecision] [WITH TIME ZONE] 

TIMESTAMP [timePrecision] [WITH TIME ZONE] 

DATE 用 于 存储 用 YEAR、MONTH 和 DAY 字段 表示 的 日 历 日 期 。TIME 用 于 存储 用 
HOUR, MINUTE 和 SECOND 字段 表示 的 时 间 。TIMESTAMP 用 于 存储 日 期 和 时 间 。 时 
间 精 度 (timePrecision) 是 一 个 十 进 制 数 ,给 出 秒 的 精度 。TIME 默认 精度 为 0 ( 即 整 秒 )， 
TIMESTAMP 默认 值 为 6 ( 即 微 秒 )。 关 键 字 WITH TIME ZONE 决定 了 字段 TIMEZONE_ 
HOUR 和 TIMEZONE_MINUTE 字段 的 表示 。 例 如 ， 表 Viewing 中 的 date 列表 示 客 户 看 房 
的 日 期 (year，month ，day)， 声 明 如 下 : 

viewDate DATE 
间隔 型 数据 

间 隅 数据 类 型 表示 一 段 时 间 。 每 个 间隔 类 型 由 下 列 字 段 的 一 个 连续 子 集 构 成 : YEAR, 
MONTH, DAY, HOUR, MINUTE 和 SECOND。 间 隔 数 据 类 型 分 为 两 类 : F- 月 间隔 和 天 - 
时 间 间 隔 。 年 -月 类 可 只 包括 YEAR 和 MONTH 字 段 。 天 -= 时间 间隔 可 仅 包 括 从 DAY、 
HOUR, MINUTE 和 SECOND 各 字段 中 连续 的 一 段 选择 。 说 明 间 隅 类 型 的 格式 如 下 : 

INTERVAL {{startField TO endField} singleDatetimeField} 

startField = YEAR | MONTH | DAY | HOUR | MINUTE 

[(intervalLeadingFieldPrecision)] 
endField = YEAR | MONTH | DAY | HOUR | MINUTE | SECOND 
[(fractionalSecondsPrecision)] 


singleDatetimeField = startField | SECOND 
[(intervalLeadingFieldPrecision [, fractionalSecondsPrecision])| 


在 所 有 情况 下 ，startField 有 个 开头 字段 精度 ， 其 默认 值 为 2。 例如 : 
INTERVAL YEAR(2) TO MONTH[ 
表示 一 个 时 间 间 隔 ， 值 从 0 年 0 个 月 到 99 年 11 个 月 。 
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INTERVAL HOUR TO SECOND(4) 
表示 一 个 时 间 间 隅 ， 值 从 0 小 时 0 分 钟 0 秒 到 99 小 时 59 分钟 59.9999 Fb ( 秒 的 小 数 精度 
为 4)。 
大 对 象 型 数据 

大 对 象 数 据 类 型 用 于 表示 大 量 数据 ， 例 如 长 文本 文件 或 图 形 文件 。SQL 中 可 定义 三 类 不 
同 的 大 对 象 数 据 类 型 : 

e 二 进 制 大 对 象 (BLOB) 为 二 进 制 串 ,没有 对 应 的 字符 集 或 排序 规则 (collation 


association ) 。 
© 字符 大 对 象 (CLOB) 和 自然 字符 大 对 象 (NCLOB) 都 是 字符 串 。 
第 9 章 将 详细 讨论 字符 串 。 


标量 运算 符 
SQL 提供 了 者 干预 定义 的 标量 运 CED: 可 用 于 构造 标量 表达 式 ， 即 表达 式 的 值 
为 标量 值 。 除 了 算术 运算 符 (+, —, *, / ) 以 外 ， 还 可 用 表 7-2 中 的 运算 符 。 
表 7-2 ISO SQL 标量 运算 符 
运 算 符 = x 
OCTET LENGTH 以 八 位 二 进 制 字 节 为 单位 ， 返 回 字符 串 的 长 度 (位 长 度 除 以 8)。 例 如 ， 


OCTET LENGTH (X 'FFFF') 返回 2 


以 字符 为 单位 ， 返 回 字符 串 的 长 度 (如 果 是 位 字符 串 ， 以 八 位 字 节 为 单位 )。 例 
Wl, CHAR LENGTH ('Beech') 返回 5 


CAST 把 值 表 达 式 中 一 种 数据 类 型 转换 为 另 一 种 数据 类 型 。 例 如 ，CAST (5.2E6 AS 
INTEGER ) 


| 连接 两 个 字符 串 或 位 字符 串 。 例 如 ，fName || IName 

CURRENT USER 或 USER 返回 表示 当前 权限 标识 的 字符 串 ( 非 形式 地 说 ， 就 是 当前 用 户 名 ) 

SESSION USER 返回 表示 SQL 会 话 权 限 标 识 的 字符 串 

SYSTEM USER 返回 表示 调用 当前 模块 的 用 户 标 识 的 字符 串 

把 大 写字 母 转换 为 小 写字 母 。 例 如 ，LOWER (SELECT fName FROM Staff 


CHAR LENGTH 


SANER WHERE staffNo='SL21') 返回 'join' 
UPPER 把 小 写字 母 转换 为 大 写字 母 。 例 如 ，UPPER (SELECT fName FROM Staff 
WHERE staffNo='SL21') 返回 'JOHN' 
TRIM 把 开始 ( LEADING), 445 ( TRAILING) 或 两 者 (BOTH) 的 字符 从 字符 串 中 
Eti, 例如，TRIM (BOTH '*' FROM '*** Hello World ***') 返回 "Hello World’ 
POSITION l 返回 一 个 字符 串 在 另 一 个 字符 串 中 的 位 置 。 例 如 ，POSITION ('ee' IN 'Beech') 
返回 2 
SUBSTRING . 从 一 个 字符 串 中 返回 一 个 子 字符 串 。 例如 ，SUBSTRING ('Beech' FROM 1 TO 3 ) 
返回 串 'Bee' 
基于 某 个 条 件 ， 返回 指定 值 集合 中 的 某 个 值 。 例 如 ， 
CASE type 
CASE WHEN ‘House’ THEN | 
WHEN Fiat’ THEN 2 
ELSE 0 


END 
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( 续 ) 
运 算 符 E xX 
CURRENT DATE 返回 用 户 当 地 当前 日 期 
返回 当前 会 话 中 上 默认 时 区 的 当前 时 间 。 如 ，CURRENT_TIME (6) 给 出 一 个 到 
CURRENT TIME 微 秒 精度 的 时 间 
返回 当前 会 话 中 默认 时 区 的 当前 日 期 和 时 间 。 如 ,CURRENT _TIMESTAMP (0) 
CURRENT _ TIMESTAMP 给 出 精度 为 秒 的 时 间 


返回 日 期 时 间 值 或 间隔 值 中 某 指定 域 的 值 。 如 ,EXTRACT ( YEAR FROM 


SR cigs Registration.dateJoined ) 

ABS 对 单个 数 操 作 返 回 其 绝对 值 ， 并 采用 与 操作 数 最 相近 的 类 型 。 例 如 ABS 
(-17.1 ) 返回 17.1 

MOD 操作 两 个 无 小 数 部 分 的 定点 数 ， 返 回 第 一 个 操作 数 除 以 第 二 个 操作 数 的 模 ( 余 


数 )， 结 果 类 型 仍 为 无 小 数 部 分 的 定点 数 类 型 。 例 如 MOD(26, 11)， 结 果 为 4 
LN 计算 其 操作 数 的 自然 对 数 。 例 如 ，LN(65) 返回 4.174 (近似 ) 
计算 指数 函数 ， 也 就 是 e( 自 然 对 数 的 底 ) 的 多 少 (由 操作 数 指 出 ) 次 方 。 例 如 ， 


EXE EXP(2) 返回 7.389 (近似 ) 

POWER 求 第 一 个 操作 数 的 多 少 (由 第 二 个 操作 数 指出 ) 次 方 。 例 如 POWER (2, 3) 返回 8 
SQRT 计算 其 操作 数 的 平方 根 。 例 如 SQRT(16) 返回 4 

FLOOR 计算 小 于 或 等 于 其 操作 数 的 最 大 整数 。 例 如 FLOOR(15.7) 返回 15 

CEIL 计算 大 于 或 等 于 其 操作 数 的 最 大 整数 。 例 如 FLOOR(15.7) 返回 16 


7.2 ”完整 性 增强 特性 


本 节 讨 论 SQL 标准 提供 的 完整 性 控制 机 制 。 完 整 性 控制 包括 一 组 施加 的 约束 ， 以 避免 
数据 库 出 现 不 一 致 的 现象 。 完 整 性 约束 有 五 种 类 型 (参见 4.3 节 ); 
必须 有 值 的 数据 
域 约束 
实体 完整 性 
引用 完整 性 
一 般 性 约束 
这 些 约束 能 用 CREATE 和 ALTER TABLE 语句 定义 ， 下 面 将 会 讲 到 。 


7.2.1 必须 有 值 的 数据 


某 些 列 的 值 必须 为 有 效 值 ， 不 允许 为 空 。 空 不 同 于 空格 或 零 ， 而 是 用 来 表示 数据 不 可 
用 .丢失 或 不 合适 (参见 4.3.1 节 )。 例 如 ， 每 一 个 员工 必须 有 相应 的 职位 (比如 经 理 、 助 理 
等 )。ISO 标准 为 CREATE All ALTER TABLE 语句 提供 的 NOT NULL 列 说 明 符 实现 了 这 种 
AR. tae INA NOT NULL， 则 系统 拒绝 向 列 中 插入 空 值 ; 若 指定 列 为 NULL， 则 系统 
接受 空 值 。ISO 默认 值 为 NULL。 例 如， 定义 表 Staff 中 的 列 position 不 能 为 空 ， 定 义 如 下 : 

position VARCHAR(10) NOT NULL 


7.2.2 BAR 
每 列 都 有 一 个 域 ， 换 句 话 说， 就 是 合法 值 的 集合 (参见 4.2.1 节 )。 例 如 ， 员 工 的 性 别 
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为 “M” 或 “F”。 表 Staff 中 的 列 sex 的 域 为 仅 包含 “M” 和 “F7” 的 字符 集 。ISO 标准 在 
CREATE 和 ALTER TABLE 语句 中 提供 两 种 定义 域 的 方式 。 第 一 种 是 CHECK FA, MFX 
列 或 整个 表 定义 约束 。CHECK 子 句 的 格式 如 下 : 

CHECK (searchCondition) 


在 一 个 列 约束 中 ,CHECK 子 句 只 能 引用 已 定义 列 。 所 以 ， 为 保证 列 sex Æ “M” Al “F” 
中 取 值 ， 可 以 如 下 定义 列 : 


sex CHAR NOT NULL CHECK (sex IN (‘M’, ‘F’)) 


另外 ，ISO 标准 允许 用 CREATE DOMAIN 语句 更 加 显 式 地 定义 域 : 


CREATE DOMAIN DomainName [AS] dataType 

[DEFAULT defaultOption] 

[CHECK (searchCondition)]| 

上 式 将 域 命名 为 DomainName， 确 定 了 数据 类 型 (如 7.1.2 节 所 述 )， 一 个 可 选 的 默认 值 
和 一 个 可 选 的 CHECK 约束 。 这 时 不 是 完整 的 定义 , 但 足以 说 明基 本 的 概念 。 所 以 ， 可 以 定 
X sex 域 如 下 : 

CREATE DOMAIN SexType AS CHAR 


DEFAULT ‘M’ 
CHECK (VALUE IN ('M’, ‘F’)); 


这 样 就 创建 了 值 域 SexType, (MTR BS “M” ASF”. MH sex it, a HRZ 
SexType 代替 数据 类 型 CHAR: 
sex SexType NOT NULL 


searchCondition 还 能 查 表 。 例 如 ， 可 用 下 面 语句 创建 域 BranchNumber， 确 保 输入 的 值 
是 表 Branch 中 已 存在 的 分 公司 : 


CREATE DOMAIN BranchNumber AS CHAR(4) 
CHECK (VALUE IN (SELECT branchNo FROM Branch)); 


定义 域 约束 首选 的 方法 是 使 用 CREATE DOMAIN 语句 ， 从 数据 库 中 撤销 域 约束 可 用 
DROP DOMAIN 语句 : 


DROP DOMAIN DomainName [RESTRICT | CASCADE] 


撤销 方式 RESTRICT 2% CASCADE 指出 被 撤销 的 域 当前 正在 被 使 用 时 应 该 采取 什么 
行为 。 如 果 指 定 为 RESTRICT， 而 该 域 正 被 用 于 某 个 现存 的 表 、 视 图 或 断言 的 定义 (参见 
7.2.5 节 )， 那 么 撤销 失败 。 若 指定 为 CASCADE， 则 任 一 表 中 基于 该 域 的 的 列 都 会 自动 地 变 
为 用 该 域 的 基 类 型 定义 ， 同 时 ， 在 合适 的 情况 下 ， 该 域 上 的 任何 约束 或 default 子 句 也 都 会 
被 列 约 束 和 列 default 子 句 代替 。 


7.2.3 ”实体 完整 性 


表 中 每 一 行 的 主 关键 字 必 须 是 唯一 的 非 空 值 。 例 如 ， 表 PropertyForRent 的 每 一 行 都 有 
一 个 唯一 的 房产 编号 propertyNo 值 ， 它 能 唯一 地 标识 该 行 代表 的 房产 。ISO 标准 在 CREATE 
和 ALTER TABLE 语句 中 用 PRIMARY KEY 子 句 支持 实体 完整 性 。 例 如 ， 可 用 下 面 语句 定 
义 表 PropertyForRent 的 主 关键 字 : 
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PRIMARY KEY (propertyNo) 

定义 组 合 关键 字 需 用 PRIMARY KEY 子 句 指定 多 个 列 名 字 ， 它 们 之 间 用 逗号 分 开 。 例 
如 ， 定 义 表 Viewing 的 组 合 关 键 字 ， 包 括 列 clientNo 和 propertyNo， 语 句 如 下 : 

PRIMARY KEY (clientNo, propertyNo) 


每 个 表 中 只 能 使 用 一 个 PRIMARY KEY 子 句 。 但 是 ， 可 用 关键 字 UNIQUE 保证 列 的 
唯一 性 。UNIQUE 子 句 中 出 现 的 每 个 列 必须 被 声明 为 NOT NULL。 每 个 表 中 可 能 有 多 个 
UNIQUE 子 句 。 硅 INSERT 或 UPDATE 操作 试图 为 候选 关键 字 ( 即 主 关 键 字 或 可 选 关键 字 ) 
创建 重复 值 ，SQL 将 会 拒绝 操作 。 例 如 表 Viewing 也 可 以 写 为 : 


clientNo VARCHAR(5) NOT NULL, 
propertyNo VARCHAR(5) NOT NULL, 
UNIQUE (clientNo, propertyNo) 

7.2.4 引用 完整 性 


外 部 关键 字 是 某 个 列 或 列 集合 ， 它 把 包含 外 部 关键 字 的 子 表 中 的 每 个 元 组 与 父 表 中 包 
含 匹 配 候选 关键 字 值 的 元 组 关联 起 来 。 引 用 完整 性 是 指 ， 外 部 关键 字 必 须 是 父 表 中 已 存在 
的 有 效 的 元 组 (参见 4.3.3 节 )。 例 如 ， 表 PropertyForRent 中 的 一 处 房产 通过 分 公司 编号 列 
branchNo 可 与 表 Branch 中 的 某 一 元 组 相连 接 ， 该 元 组 就 是 该 房产 注册 的 分 公司 。 也 就 是 
说 ， 表 PropertyForRent 的 某 个 元 组 ， 如 果 分 公司 编号 非 空 ， 则 它 的 值 必须 是 表 Branch 中 列 
branchNo 的 某 个 有 效 值 ， 否 则 该 分 公司 编号 当 是 无 效 的 。 

ISO 标准 允许 在 CREATE 和 ALTER TABLE 语句 中 使 用 FOREIGN KEY 子 句 定义 外 部 
关键 字 。 例 如 ， 可 用 下 面 语句 定义 表 PropertyForRent 的 外 部 关键 字 branchNo: 


FOREIGN KEY (branchNo) REFERENCES Branch 


te -¥ Ze 'P 4 ik AA INSERT A UPDATE 操作 ， 创 建 与 父 表 中 候选 关键 字 不 匹配 的 外 部 
KEF, SQL 则 会 拒绝 该 操作 。 而 在 父 表 中 者 试图 用 UPDATE 和 DELETE 操作 更 新 或 删除 
与 子 表 有 匹配 行 的 候选 关键 字 ，SQL 将 根据 FOREIGN KEY 子 句 中 的 ON UPDATE 或 ON 
DELETE 子 句 来 决定 如 何 执行 该 操作 。 当 用 户 企 图 删除 父 表 中 的 某 行 时 ， 子 表 中 有 一 个 或 多 
个 匹配 行 ，SQL 有 四 种 选择 : 

e CASCADE : 删除 父 表 中 的 行 并 且 自 动 删除 子 表 中 匹配 的 行 。 由 于 删除 的 行 可 能 有 
候选 关键 字 是 另 一 个 表 的 外 部 关键 字 ， 所 以 这 些 表 的 外 部 关键 字 规 则 就 会 以 级 联 的 
方式 相继 触发 。 

e SET NULL: 删除 父 表 中 的 元 组 是 设置 子 表 中 的 外 部 关键 字 为 NULL。 只 有 当 外 部 关 
键 字 列 没有 指定 为 NOT NULL 时 ， 这 样 做 才 是 有 效 的 。 

è SET DEFAULT : 删除 父 表 中 的 元 组 且 设 子 表 中 的 外 部 关键 字 为 默认 值 。 只 有 当 外 部 
关键 字 列 指定 了 DEFAULT 值 时 ， 这 样 做 才 是 有 效 的 (参见 7.3.2 节 )。 

e NO ACTION : 拒绝 对 父 表 进行 删除 操作 。ON DELETE 规则 的 默认 设置 为 NO 
ACTION。 

更 新 父 表 中 的 候选 关键 字 时 ，SQL 支持 与 删除 相同 的 选择 。 通 过 CASCADE 方式 ， 子 

表 中 的 外 部 关键 字 设 置 为 父 表 中 新 的 候选 关键 字 的 值 。 同 样 ， 如 果子 表 中 更 新 的 列 又 为 另 一 
个 表 的 外 部 关键 字 ， 就 会 依次 更 新 。 
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例如 ， 表 PropertyForRent 中 的 员工 编号 staffNo 是 引用 表 Staff 的 外 部 关键 字 。 可 以 
指定 删除 规则 为 ， 如 果 表 Staff 中 的 员工 记录 删除 ， 则 对 应 的 表 PropertyForRent 中 相应 的 
staffNo 列 的 值 设置 为 NULL. 

FOREIGN KEY (staffNo) REFERENCES Staff ON DELETE SET NULL 


类 似 地 ， 表 PropertyForRent 中 的 业主 编号 ownerNo 是 引用 表 PrivateOwner 的 外 部 关键 
字 。 可 以 指定 更 新 规则 为 ， 如 果 表 PrivateOwner 中 的 业主 编号 更 新 ， 则 表 PropertyForRent 
中 的 相应 列 设置 为 更 新 值 : 


FOREIGN KEY (ownerNo) REFERENCES PrivateOwner ON UPDATE CASCADE 


7.2.5 一 般 性 约束 


对 表 的 更 新 可 能 受到 企业 规则 的 约束 ， 企 业 规则 用 来 控制 该 更 新 操作 所 代表 的 现实 世 
界 中 的 事务 。 例 如 ，DreamHome 可 能 有 规定 ， 禁 止 员 工 同 时 管理 100 处 以 上 房产 。ISO 
标准 允许 用 CREATE fil ALTER TABLE 语句 中 的 CHECK ll UNIQUE F “J LA & CREATE 
ASSERTION 语句 指 定 一 般 性 约束 。CHECK 和 UNIQUE 子 句 本 节 前 面 已 经 讲述 过 ， 
CREATE ASSERTION 语句 是 不 直接 与 表 定 义 相 关联 的 完整 性 约束 。 语 句 格 式 如 下 : 


CREATE ASSERTION AssertionName 
CHECK (searchCondition) 


这 个 语句 非常 类 似 于 前 面 讨 论 过 的 CHECK 子 句 。 如 果 一 般 性 约束 作用 于 多 个 表 ， 则 较 
好 的 选择 是 使 用 一 个 ASSERTION 语句 ， 而 不 是 在 每 一 个 表 中 复制 CHECK 语句 或 在 任意 表 
中 设置 约束 。 例 如 ， 定 义 一 般 性 约束 ， 禁 止 员工 同时 管理 100 处 以 上 的 房产 ， 语 名 如 下 : 


CREATE ASSERTION StaffNotHandlingTooMuch 
CHECK (NOT EXISTS (SELECT staffNo 
FROM PropertyForRent 
GROUP BY staffNo 
HAVING COUNT(*) > 100)) 


下 面 草 节 讲 到 CREATE 和 ALTER TABLE 语句 时 ， 将 讲述 如 何 使 用 这 些 完整 性 增强 特性 。 


7.3 数据 定义 


SQL 数据 定义 语言 (DDL) 允许 创建 和 删除 模式 、 域 、 表 、 视 图 和 索引 等 数据 库 对 
象 。 本 节 简 单 讨 论 如 何 创 建 和 删除 模式 、 表 和 索引 。ISO 标准 也 允许 创建 字符 集 、 序 列 
(collation)、 转 变 规 则 (translation)。 但 是 ， 本 书 并 不 讨论 这 些 数据 库 对 象 ， 有 兴趣 的 读者 可 
参考 Cannan and Otten ( 1993 ), 


SQL 主要 的 数据 定义 语句 为 : 

CREATE SCHEMA DROP SCHEMA 
CREATE DOMAIN ALTER DOMAIN DROP DOMAIN 
CREATE TABLE ALTER TABLE DROP TABLE 
CREATE VIEW DROP VIEW 


这 些 语句 用 于 创建 、 更 新 和 删除 概念 模式 。 许 多 DBMS 提供 下 面 两 个 语句 ， 虽然 SQL 
标准 并 不 文 持 : 


CREATE INDEX DROP INDEX 
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还 有 一 些 命令 可 供 数据 库 管 理 员 (DBA) 用 于 指定 数据 存储 的 物理 细节 ， 这 里 不 进行 讨 
论 ， 因 为 这 些 命令 是 随 具体 系统 而 不 同 的 。 


7.3.1 创建 数据 库 


不 同 产品 的 数据 库 创 建 过 程 是 截然 不 同 的 。 多 用 户 系统 中 ， 创 建 数据 库 的 权限 通常 为 
DBA 保留 。 单 用 户 系统 中 ， 通 常 在 系统 安装 和 配置 时 创建 一 个 默认 数据 库 ， 其 他 数据 库 可 以 
由 用 户 在 需要 时 创建 ,1SO 标准 并 不 指定 如 何 创建 数据 库 ， 每 种 具体 实现 都 有 各 上 自 不 同 的 方式 。 

根 ISO 标准 ， 关 系 和 其 他 的 数据 库 对 象 都 存在 于 某 个 环境 中 。 每 个 环境 含 一 个 或 多 
个 目录 ， 每 个 目录 中 包括 一 组 模式 。 模 式 是 一 组 数据 库 对 象 的 命名 集合 ， 该 集合 中 的 对 象 以 
某 种 方式 相互 关连 (数据 库 中 出 现 的 任 一 对 和 象 不 在 这 个 就 在 那个 模式 中 描述 )。 模 式 中 的 对 
象 可 以 是 表 、 视 图 、 域 、 声 明 、 序 列 、 转 变 规 则 和 字符 集 。 模 式 中 的 所 有 对 象 有 相同 的 所 有 
A It ASE a FRE. 

ISO 标准 把 创建 和 删除 目录 的 机 制 留 给 了 具体 负责 实现 的 供应 商 来 定义 ， 但 标准 提供 了 
创建 和 删除 模式 的 机 制 。 模 式 定 义 语句 有 如 下 形式 : 

CREATE SCHEMA [Name | AUTHORIZATION Creatoridentifier] 

所 以 ， 知 模式 SqlTests 的 创建 者 是 Smith, M) SQL 语句 应 为 : 

CREATE SCHEMA SaiTests AUTHORIZATION Smith; 


ISO 标准 也 指出 ， 可 以 在 该 语句 中 指定 该 模式 的 用 户 拥 有 设施 的 范围 ， 但 如 何 指 定 这 些 
权限 的 具体 过 程 则 依赖 于 具体 实现 。 

可 以 使 用 DROP SCHEMA 语句 删除 模式 ， 形 式 如 下 : 

DROP SCHEMA Name [RESTRICT | CASCADE] 


如 果 指 定 了 RESTRICT ( 它 也 是 默认 值 )， 则 模式 必须 为 空 ， 否 则 删除 操作 将 失败 。 如 
果 指 定 CASCADE， 那 么 将 按 前 面 定 义 的 顺序 级 联 地 删除 与 模式 相关 的 所 有 对 象 。 如 果 
其 中 任 一 删除 操作 失败 ， 则 DROP SCHEMA 操作 失败 。 带 有 CASCADE 限定 符 的 DROP 
SCHEMA 语句 影响 的 范围 非常 大 ， 使 用 时 一 定 要 十 分 小 心 谨 愤 。 值 得 注意 的 是 ，CREATE 
和 DROP SCHEMA 语句 并 未 得 到 广泛 的 实现 。 


7.3.2 创建 表 (CREATE TABLE) 


创建 数据 库 结 构 后 ， 就 可 以 在 数据 库 中 为 基本 关系 创建 表 结 构 。 可 以 通过 CREATE 
TABLE 语句 实现 ， 该 语句 基本 语法 规则 如 下 : 


CREATE TABLE TableName 
{(columName dataType [NOT NULL] [UNIQUE] 
[DEFAULT defaultOption] [CHECK (searchCondition)] [, . . .]} 
[PRIMARY KEY (listOfColumns), | 
{[UNIQUE (listOfColumns)] [, . . .]} 
{{[FOREIGN KEY (listOfForeignKeyColumns) 
REFERENCES ParentTableName | (listOfCandidateKeyColumns) | 
[MATCH {PARTIAL | FULL} 
[ON UPDATE referentialAction] 
[ON DELETE referentialAction]] [, . . .]} 
{{CHECK (searchCondition)] |, . . .]}) 
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正如 前 面 章节 讨论 过 的 ， 该 版 本 中 的 CREATE TABLE 语句 整合 了 引用 完整 性 和 其 他 约 
束 的 功能 。 不 同 的 实现 对 该 版 本 语句 提供 的 支持 有 很 大 的 差别 。 但 只 要 提供 了 支持 ， 就 可 使 
用 这 些 特性 。 

CREATE TABLE 语句 创建 一 个 名 为 TableName 的 表 ， 该 表 包 括 一 个 或 多 个 指定 了 数据 
类 型 (dataType) 的 列 。 人 允许 使 用 的 数据 类 型 集合 在 7.1.2 WER. ENJ DEFAULT FA 
可 以 为 特定 列 提供 默认 值 。 如 果 INSERT 语句 没有 为 该 列 赋值 ，SQL 就 使 用 该 默认 值 。 除 了 
其 他 值 外 ，defaultOption 还 可 以 包括 文字 。NOT NULL, UNIQUE 和 CHECK 子 句 在 上 一 节 
已 经 讨论 过 了 。 剩 下 的 子 句 均 称 为 表 约 束 ， 可 以 选择 下 列子 句 作 为 前 级 : 

CONSTRAINT ConstraintName 


这 样 做 的 目的 是 可 用 ALTER TABLE 语句 通过 约束 名 删除 相关 约束 ( 见 下 面 )。 

PRIMARY KEY 子 句 指定 表 的 主 关 键 字 列 。 如 果 该 子 句 可 用 ， 则 应 在 创建 每 个 表 时 使 用 
该 子 句 指定 主 关键 字 。 主 关键 字 中 的 每 一 个 列 默 认为 NOT NULL。 每 个 表 都 只 能 使 用 一 次 
PRIMARY KEY 子 句 。SQL 拒绝 任何 使 PRIMARY KEY 列 值 重复 的 INSERT 和 UPDATE 操 
作 。 通 过 这 种 方式 ，SQL 可 以 保证 主 关键 字 的 唯一 性 。 

FOREIGN KEY 子 句 指定 (T) 表 中 外 部 关键 字 及 其 与 男 一 个 (R) 表 的 联系 。 该 子 句 
实现 了 引用 完整 性 约束 ， 并 且 指 定 了 下 列 内 容 : 

e listOfForeignKeyColumns， 创 建 表 时 组 成 外 部 关键 字 的 一 个 或 多 个 列 。 

è REFERENCES 子 句 给 出 了 父 表 ， 即 具有 匹配 关键 字 的 表 。 如 果 省 略 了 1listOfCandidate- 
KeyColumns， 则 认为 外 部 关键 字 和 父 表 的 主 关 键 字 相 匹 配 。 这 时 ， 父 表 的 CREATE 
TABLE 语句 必须 含有 PRIMARY KEY 子 句 。 

当 与 子 表 外 部 关键 字 匹 配 的 父 表 中 候选 关键 字 更 新 时 ， 可 选 的 联系 更 新 规则 (ON 
UPDATE) 指定 应 采取 的 动作 。referentialAction 可 以 是 CASCADE、SET NULL, 
SET DEFAULT 或 NO ACTION。 如 果 ON UPDATE 子 句 省 略 ， 默 认 值 为 NO ACTION 
(参见 7.2 节 )。 

当 与 子 表 外 部 关键 字 匹 配 的 父 表 中 候选 关键 字 被 删除 时 ， 可 选 的 联系 删除 法 则 (ON 
DELETE) 指定 应 采取 的 行动 。referentialAction 与 ON UPDATE 规则 相同 。 

在 默认 情况 下 ， 如 果 外 部 关键 字 的 某 列 为 空 或 在 父 表 中 存在 一 个 匹配 行 ， 引 用 约 
束 就 得 到 满足 。 可 用 MATCH 选项 对 外 部 关键 字 中 存在 空 值 的 情况 施加 另外 的 限 
mlo WRIS MATCH FULL， 则 外 部 关键 字 或 全 部 为 空 或 全 部 非 空 。 如 果 指 定 为 
MATCH PARTIAL， 则 外 部 关键 字 各 列 或 者 全 部 为 空 ， 或 者 当 那 些 为 空 的 列 被 正确 
代入 值 时 ， 父 表 中 至 少 有 一 行 能 够 满足 约束 。 一 些 人 认为 引用 完整 性 应 该 仅 允 许 
MATCH FULL。 

根据 需要 ， 可 以 存在 多 个 FOREIGN KEY 子 句 。CHECK 和 CONSTRAINT 子 句 允许 定 
义 另 外 的 约束 。 如 果 用 作 列 约束 ， 则 CHECK 子 句 只 能 引用 定义 的 列 。 每 一 个 SQL 语句 执 
行 时 ,约束 都 得 到 有 效 的 检查 ， 尽 管 这 种 检查 可 以 延迟 到 事务 运行 的 最 后 (参见 7.5 节 )。 例 
7.1 说 明了 这 一 版 本 的 CREATE TABLE 语句 的 潜力 。 


| 例 7.1》》CREATE TABLE 
使 用 CREATE TABLE 语句 创建 表 PropertyForRent。 
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CREATE DOMAIN OwnerNumber AS VARCHAR(5) 
CHECK (VALUE IN (SELECT ownerNo FROM PrivateOwner)); 
CREATE DOMAIN StaffNumber AS VARCHAR(5) 
CHECK (VALUE IN (SELECT staffNo FROM Staff)); 
CREATE DOMAIN BranchNumber AS CHAR(4) 
CHECK (VALUE IN (SELECT branchNo FROM Branch)); 
CREATE DOMAIN PropertyNumber AS VARCHAR(5); 
CREATE DOMAIN Street AS VARCHAR(25); 
CREATE DOMAIN City AS VARCHAR(15); 
CREATE DOMAIN Postcode AS VARCHAR(38); 
CREATE DOMAIN PropertyType AS CHAR(1) 
CHECK(VALUE IN (‘B’, ‘C’, ‘D’, ‘E, ‘F, *M’, °S’)); 
CREATE DOMAIN PropertyRooms AS SMALLINT; 
CHECK(VALUE BETWEEN 1 AND 15); 
CREATE DOMAIN PropertyRent AS DECIMAL(6,2) 
CHECK(VALUE BETWEEN 0 AND 9999.99); 
CREATE TABLE PropertyForRent( 


propertyNo PropertyNumber NOT NULL, 

street Street NOT NULL, 

city City NOT NULL, 

postcode PostCode, 

type PropertyType NOT NULL DEFAULT 'F’, 
rooms PropertyRooms NOT NULL DEFAULT 4, 
rent PropertyRent NOT NULL DEFAULT 600, 
ownerNo OwnerNumber NOT NULL, 

staffNo StaffNumber 


CONSTRAINT StaffNotHandlingTooMuch 
CHECK (NOT EXISTS (SELECT staffNo 
FROM PropertyForRent 
GROUP BY staffNo 
HAVING COUNT(*) > 100)), 
branchNo BranchNumber NOT NULL, 
PRIMARY KEY (propertyNo), 
FOREIGN KEY (staffNo) REFERENCES Staff ON DELETE SET NULL 
ON UPDATE CASCADE, 
FOREIGN KEY (ownerNo) REFERENCES PrivateOwner ON DELETE NO 
ACTION ON UPDATE CASCADE, 
FOREIGN KEY (branchNo) REFERENCES Branch ON DELETE NO 
ACTION ON UPDATE CASCADE); 


房产 类 型 列 type 的 默认 值 指定 为 (代表 Flat)。 员 工 编号 列 使 用 CONSTRAINT F 
人 句 来 确保 每 个 员工 不 会 管理 太 多 的 房产 。 这 个 约束 检查 员工 当前 管理 的 房产 数量 是 否 大 于 
100 处 。 

主 关 键 字 为 房产 编号 propertyNo。SQL 自动 强制 实现 这 个 列 的 唯一 性 。 员 工 编 号 
staffNo 是 引用 表 Staff 的 外 部 关键 字 。 指 定 了 删除 规则 ， 比 如 ， 如 果 一 个 记录 从 表 Staff 中 
WEE, MÆ PropertyForRent 中 对 应 的 staffNo 列 设 为 NULL。 另 外 ， 指 定 了 更 新 规则 ， 比 
如 ， 表 Staff 中 的 员工 编号 更 新 ，PropertyForRent 中 对 应 的 staffNo 列 相 应 地 更 新 。 业 主编 
号 ownerNo 是 引用 表 PrivateOwner 的 外 部 关键 字 。 指 定 了 NO ACTION 删除 规则 ， 如 果 表 
PrivateOwner 的 ownerNo FI EX PropertyForRent 中 有 匹配 的 值 时 ， 可 保护 该 值 不 被 删除 。 
指定 了 CASCADE 更 新 规则 ， 当 业主 编号 更 新 时 ， 表 PropertyForRent 中 对 应 的 ownerNo 值 
设置 为 更 新 的 值 。 相 同 的 规则 可 用 于 branchNo 列 。 所 有 的 FOREIGN KEY 约束 中 ， 因 为 省 
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i T listOfCandidate-KeyColumns, 所 以 SQL 假定 外 部 关键 字 和 相应 父 表 中 的 主 关键 字 相 
匹配 。 

注意 ， 员 工 编 号 列 staffNo 并 未 指定 为 NOT NULL， 因 为 可 能 在 某 一 段 时 间 内 还 没有 
分 配 员 工 去 管理 该 房产 (例如 ， 房 产 刚刚 登记 )。 然 而， 其 他 外 部 关键 字 一 一 ownerNo 和 
branchNo 必须 指定 为 NOT NULL. K4 


7.3.3 修改 表 定 义 (ALTER TABLE) 


创建 表 后 ， 还 可 以 使 用 ISO 标准 提供 的 ALTER TABLE 语句 改变 表 的 结构 。SQL 标准 
中 ALTER TABLE 语句 的 定义 包括 六 个 选项 : 

e 在 表 中 添加 一 个 新 列 
从 表 中 删除 一 个 列 
添加 一 项 新 的 表 约 束 
删除 一 项 表 约 束 
设置 列 默认 值 
删除 列 默认 值 

语句 的 基本 格式 如 下 : 

ALTER TABLE TableName 

[ADD [COLUMN] columnName dataType [NOT NULL] [UNIQUE] 

[DEFAULT defaultOption] [CHECK (searchCondition)]] 

[DROP [COLUMN] columnName [RESTRICT | CASCADE]] 

[ADD [CONSTRAINT [ConstraintName]] tableConstraintDefinition] 

[DROP CONSTRAINT ConstraintName [RESTRICT | CASCADE}] 

[ALTER [COLUMN] SET DEFAULT defaultOption] 

[ALTER [COLUMN] DROP DEFAULT] 

这 里 的 参数 和 前 面 章 节 讲 述 的 CREATE TABLE 语句 定义 的 参数 一 样 。tableConstraint- 
Definition 为 下 面子 句 中 的 某 一 个 : PRIMARY KEY, UNIQUE, FOREIGN KEY 或 CHECK。 
ADD COLUMN 子 句 类 似 CREATE TABLE 语句 中 的 列 定 义 。DROP COLUMN 子 句 指定 从 
表 定 义 中 删除 的 列 的 名 称 ， 并 有 一 个 可 选 的 标识 符 指出 DROP 操作 是 否 是 级 联 操 作 。 

èe RESTRICT : 如 果 某 列 被 另外 的 数据 库 对 象 (例如 ， 视 图 定义 ) 引用 ， 则 SQL 拒绝 

进行 DROP 操作 。 这 是 默认 的 设置 。 

e CASCADE : 进行 DROP 操作 ， 并 自动 从 所 有 引用 该 列 的 数据 库 对 象 中 删除 这 一 列 。 

此 操作 级 联 进 行 。 即 从 引用 对 象 中 删除 此 列 时 ，SQL 检查 这 一 列 是 否 又 被 其 他 对 象 
引用 ， 如 果 是 则 在 那儿 又 将 其 删除 ， 一 直 这 样 进行 下 去 。 


| 例 7.2 >» ALTER TABLE 
(a) 修改 表 Staff, MEF! position KYRA “Assistant”, Hix #7) sex 的 默认 值 为 女性 (F)。 
ALTER TABLE Staff 
ALTER position DROP DEFAULT; 
ALTER TABLE Staff 
ALTER sex SET DEFAULT ‘F’; 
(b) 修改 表 PropertyForRent， 删 除 员工 不 能 同时 管理 100 处 以 上 房产 的 约束 。 修 改 表 
Client， 增 加 一 个 新 的 列表 示 他 对 房间 数 的 意愿 。 
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ALTER TABLE PropertyForRent 
DROP CONSTRAINT StaffNotHandlingTooMuch; 
ALTER TABLE Client 
ADD prefNoRooms PropertyRooms; 《发 


ALTER TABLE 语句 不 是 在 SQL 的 所 有 具体 实现 中 都 可 用 。 在 一 些 实现 版 本 中 ， 
ALTER TABLE 语句 不 能 用 于 从 表 中 删除 已 存在 的 列 。 这 时 ， 如 果 不 再 需要 某 个 列 ， 只 能 简 
单 地 忽略 这 个 列 ， 但 它 实际 还 存在 于 表 定 义 中 。 如 果 和 希望 将 其 从 表 中 删除 ， 必 须 进 行 以 下 
几 步 : 

e 上 传 表 中 的 所 有 数据 。 

e 用 DROP TABLE 语句 删除 该 表 的 定义 。 

e 用 CREATE TABLE 语句 重新 定义 一 个 新 表 。 

e 将 数据 重新 载 人 新 表 。 | | 

上 传 和 重 载 步骤 可 用 DBMS 提供 的 专用 程序 来 实现 。 也 可 以 创建 一 个 临时 的 表 ， 用 
INSERT...SELECT 语句 把 旧 表 的 数据 载 和 临时 表 ， 然 后 再 从 临时 表 上 传 到 新 表 中 。 


7.3.4 删除 表 (DROP TABLE) 


随 着 时 间 的 推移 ， 数 据 库 的 结构 将 会 发 生变 化 ; 一 些 新 表 被 创建 ， 而 一 些 老 表 则 不 再 需 
要 。 可 用 DROP TABLE 语句 删除 数据 库 中 多 余 的 表 ， 格 式 如 下 : 
DROP TABLE TableName [RESTRICT | CASCADE] 


例如 ， 可 用 下 面 的 命令 删除 表 PropertyForRent: 
DROP TABLE PropertyForRent; 


注意 ， 这 个 命令 不 仅 删 除 指 名 的 表 ， 还 删除 其 所 有 的 行 。 知 只 想 删 除 表 中 的 行 ， 仍 保留 
表 的 结构 ， 则 可 用 DELETE 语句 (参见 6.3.10 节 )。DROP TABLE 语句 允许 指定 删除 操作 是 
以 级 联 还 是 以 其 他 方式 进行 。 

e RESTRICT: 如 果 存 在 任何 其 他 对 象 依赖 于 将 要 删除 的 表 ， 则 拒绝 进行 DROP 操作 。 

e CASCADE : 存在 依赖 的 情况 下 也 允许 进行 DROP 操作 ， 只 是 同时 自动 删除 所 有 依 

赖 的 对 象 (包括 依赖 于 这 些 对 象 的 对 象 )。 

带 CASCADE 的 DROP TABLE 语句 的 影响 范围 很 大 ,使 用 时 一 定 要 小 心 着 慎 。 创 建 
表 时 若 发 现 出 错 ， 通 常 使 用 DROP TABLE 纠 错 。 即 如 果 某 个 表 创 建 时 结构 就 不 正确 ， 那 么 
DROP TABLE 可 以 删除 刚 建 的 表 ， 重 新 开始 。 


7.3.5 ”创建 索引 (CREATE INDEX) 


索引 是 一 种 结构 ， 它 提供 了 基于 一 个 或 多 个 列 值 快速 访问 表 中 元 组 的 方法 (参见 附录 
F 关于 索引 的 讨论 ， 了 解 如 何 使 用 索引 提高 数据 检索 的 效率 )。 索 引 的 出 现 极 大 地 提高 了 查 
询 的 性 能 。 然 而 ， 由 于 每 一 次 更 新 基本 关系 时 系统 都 可 能 会 更 新 索引 ， 所 以 将 导致 额外 的 
开销 。 通 常 ， 建 立 索引 是 在 表 使 用 一 段 时 间 后 ， 这 时 规模 有 所 增加 而 又 需 满足 特殊 的 查找 
BOK, SQL 标准 中 并 未 对 创建 索引 进行 规定 。 然 而 ， 大 多 数 的 实现 版 本 至 少 可 以 文 持 下 列 
语句 : 


CREATE [UNIQUE] INDEX IndexName 
ON TableName (columnName [ASC | DESC] [, . . .]) 
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指定 的 列 构成 索引 关键 字 ， 这 些 列 应 该 按 从 主要 到 次 要 的 顺序 排列 。 索 引 只 能 基于 基 表 
建立 ， 而 不 能 基于 视图 。 如 果 使 用 UNIQUE 子 句 ，DBMS 将 强制 实现 索引 列 或 列 组 合 的 唯 
一 性 。 这 对 于 主 关键 字 是 必然 要 求 ， 对 于 其 他 列 〈 例 如 ， 候 选 关键 字 ) 也 可 能 有 此 要 求 。 尽 
管 索引 在 任何 时 候 都 可 以 创建 ， 但 是 对 已 包含 记录 的 表 创 建 唯一 性 索引 存在 一 定 困 难 ， 因 为 
索引 列 可 能 已 经 存在 重复 值 了 。 所 以 在 创建 基 表 时 ， 如 果 所 用 DBMS 不 能 自动 强制 实现 主 
关键 字 的 唯一 性 ， 至 少 建议 为 主 关 键 字 创 建 唯一 性 索引 。 

对 于 表 Staff AIX PropertyForRent， 至 少 应 该 创建 下 面 的 索引 : 

CREATE UNIQUE INDEX StaffNoind ON Staff (staffNo); 

CREATE UNIQUE INDEX PropertyNoind ON PropertyForRent (propertyNo); 

对 于 每 个 列 ， 可 以 指定 以 升序 (ASC) 或 降序 (DESC) 排列 ， 默 认 设 置 是 ASC。 例 如 ， 
在 表 PropertyForRent 上 建立 索引 如 下 : 


CREATE INDEX Rentind ON PropertyForRent (city, rent); 


这 样 ， 就 根据 表 PropertyForRent 创建 了 名 为 RentInd 的 索引 文件 。 记 录 将 按 city 列 值 
的 字母 顺序 排序 ， 若 city 值 相 同 则 按 rent 列 排序 。 


7.3.6 ”删除 索引 (DROP INDEX) 

如 果 已 经 为 基 表 建立 了 索引 并 且 不 再 需要 索引 ， 则 可 以 用 DROP INDEX 语句 从 数据 库 
中 删除 索引 。DROP INDEX 的 格式 如 下 : 

DROP INDEX IndexName 


下 面 的 语句 将 会 删除 前 面 例子 建立 的 索引 ， 
DROP INDEX Renting; 


7.4 视图 
复习 一 下 4.4 市 中 对 视图 的 定义 。 


视图 | 为 了 得 到 另 一 个 关系 而 对 基 关 系 进 行 一 次 或 多 次 关系 操作 所 得 到 的 动态 结果 。 视 图 
是 虚 关 系 ， 即 在 数据 库 中 不 存在 ， 需 要 时 根据 特定 用 户 的 要 求 临 时 生成 。 


对 于 数据 库 用 户 来 说 ， 视 图 像 真实 表 一 样 存 在 ， 包 含 指定 列 和 行 的 集合 。 然 而 ， 与 基 
表 不 同 的 是 ， 视 图 并 不 需要 像 存 储 数 据 集合 一 样 存在 于 数据 库 中 。 相 反 ， 视 图 被 定义 成 对 一 
个 或 多 个 表 或 视图 的 查询 。DBMS 在 数据 库 中 只 存储 视图 定义 。 当 DBMS 遇 到 视图 引用 时 ， 
一 种 方法 是 查找 视图 定义 ， 并且 将 请 求 转换 为 对 于 视图 源 表 的 等 价 请 求 ， 然 后 完成 等 价 的 请 
求 操 作 。 这 个 转换 的 过 程 称 为 视图 分 解 (view resolution)， 将 在 7.4.3 节 讨 论 。 另 一 种 可 供 
选择 的 方法 称 为 视图 物化 (view materialization)， 即 把 视图 存储 在 数据 库 的 临时 表 中 ， 并 在 
基 表 变化 时 更 新 临时 表 以 及 时 维护 视图 。 视 图 物化 将 在 7.4.8 节 讨 论 。 首 先 ， 讨 论 一 下 如 何 
创建 和 使 用 视图 。 


7.4.1 创建 视图 (CREATE VIEW) 
CREATE VIEW 语句 的 格式 如 下 : 
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CREATE VIEW ViewName |[(newColumnName [, . . . ])] 
AS subselect [WITH [CASCADED | LOCAL] CHECK OPTION] 


视图 通过 指定 SQL SELECT 语句 定义 。 可 以 有 选择 地 为 视图 中 每 个 列 定义 一 个 名 字 。 
如 果 给 出 列 名 表 ， 那 它 必须 与 subselect 子 句 产 生 的 列 数目 相同 。 如 果 省 略 列 名 表 ， 视 图 中 
列 的 名 字 即 采用 subselect 子 句 中 相应 列 的 名 字 。 如 果 列 名 字 存 在 歧义 ， 就 必须 指定 列 名 表 。 
当 subselect 子 句 包含 计算 列 却 没有 使 用 AS 子 句 命名 这 些 列 时 ， 或 者 当 连 接 操 作 产 生 了 两 个 
相同 名 字 的 列 时 ， 这 种 情况 便 有 可 能 发 生 。 

subselect 称 为 定义 查询 。 如 果 说 明 WITH CHECK OPTION, SOL 将 确保 那些 不 满足 定 
义 查询 中 WHERE 子 句 的 行 不 会 被 添加 到 视图 的 基 表 中 (参见 7.4.6 节 )。 应 该 注意 的 是 ， 欲 
成 功 创建 视图 ， 则 对 subselect 中 引用 的 所 有 表 必 须 具 有 SELECT 权限 ， 而 对 任何 被 引用 列 
对 应 的 域 应 具有 USAGE 权限。 在 7.6 节 中 将 会 讨论 这 些 权 限 。 尽 管 所 有 视图 都 按 同样 的 方 
式 创 建 ， 但 实际 上 不 同类 型 的 视图 有 不 同 的 用 途 。 下 面 举例 说 明 不 同类 型 的 视图 。 


| 例 7.3 >> 创建 水 平视 图 

创建 一 个 视图 ; 让 分 公司 B003 的 经 理 只 看 到 他 所 在 分 公司 的 员工 的 情况 。 

水 平视 图 限制 用 户 只 能 访问 一 个 或 多 个 表 中 选 定 的 元 组 。 

CREATE VIEW Manager3Staff 

AS SELECT * 

FROM Staff 
WHERE branchNo = ‘B003’; 

这 样 就 创建 了 名 为 Manger3Staff 的 视图 ， 该 视图 具有 与 表 Staff 相 同 的 列 名 字 ， 但 是 只 
包括 分 公司 为 B003 的 那些 元 组 (严格 地 说 ，branchNo 列 不 再 必要 ， 可 从 视图 定义 中 省 略 ， 
因为 所 有 元 组 都 满足 branchNo='B003')。 现 在 ,执行 语 句 

SELECT * FROM Manager3Staff; 

查询 结果 如 表 7-3 所 示 。 要 确保 该 分 公司 的 经 理 只 看 到 这 些 元 组 ， 就 不 应 该 允许 他 访 
问 基 表 Staff。 而 是 给 他 访问 视图 Manger3Staff 的 权限 。 效 果 上 上 ， 就 是 为 分 公司 经 理 定制 
了 表 Staff 的 一 个 视图 ， 通 过 它 只 能 看 到 他 所 在 分 公司 的 员工 的 情况 。 访 问 权 限 将 在 7.6 节 
讨论 。 « 

% 7-3 视图 Manger3Staff 的 数据 
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SM 


| 例 7.4 D 建立 垂直 视图 

建立 一 个 视图 ， 包 括 分 公司 B003 员工 的 除 工资 外 的 信息 ， 为 的 是 只 让 经 理 看 到 员工 的 
工资 情况 。 

垂直 视图 限制 用 户 只 能 访问 一 个 或 多 个 表 中 选 定 的 列 。 
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156 PZR 关系 机 型 与 三 言 


CREATE VIEW Staff3 
AS SELECT staffNo, fName, IName, position, sex 
FROM Staff 
WHERE branchNo = ‘B003’; 
注意 可 用 视图 Manger3Staff (REK Staff 重 写 这 个 语句 : 


CREATE VIEW Staff3 
AS SELECT staffNo, fName, IName, position, sex 
FROM Manager3Staff; 

两 种 方法 都 可 以 创建 名 为 Staff3 的 视图 ， 它 除了 不 包括 列 salary, DOB 和 branchNo 外 ， 
具有 与 表 Staff 相同 的 列 。 列 出 该 视图 ， 便 可 得 出 表 7-4 所 示 的 结果 。 为 确保 只 有 分 公司 经 
理 才 能 看 到 工资 情况 ， 不 能 给 予 分 公司 B003 的 一 般 员 工 访问 基 表 Staff 和 视图 Manger3Staff 
的 权限 ， 而 是 只 给 他 们 访问 视图 Staff3 的 权限 ， 这 样 就 限制 了 他 们 对 敏感 的 工资 数据 的 
访问 。 

表 7-4 视图 Staff3 的 数据 


垂直 视图 通常 应 用 的 情形 是 ， 表 中 存储 的 数据 被 各 种 各 样 的 用 户 或 用 户 组 使 用 。 垂 下 视 
图 为 这 些 用 户 提供 了 仅 由 他 们 需要 的 列 构成 的 私有 表 。 « 


| B 7.5 D) 分 组 或 连接 视图 
创建 负责 管理 出 租房 产 的 员工 的 视图 ， 包括 员工 所 在 分 公司 的 编号 、 员 工 编号 和 他 们 管 
理 的 房产 的 数量 (参见 例 5.27 )。 


CREATE VIEW StaffPropCnt (branchNo, staffNo, cnt) 
AS SELECT s.branchNo, s.staffNo, COUNT(*) 
FROM Staff s, PropertyForRent p 
WHERE s.staffNo = p.staffNo 
GROUP BY s.branchNo, s.staffNo; 
查询 所 得 的 数据 视图 如 表 7-5 所 示 。 这 个 例子 说 明了 子 查询 的 用 法 ,包括 GROUP BY 
图 称 为 连接 视图 )。 使 用 视图 最 常见 的 一 个 原因 就 是 可 
以 简单 地 进行 多 表 查 询 。 一 旦 定义 了 一 个 连接 视图 ， 就 
可 以 将 原来 需要 多 表 连 接 的 查询 变 为 对 视图 的 简单 单 表 
查询 。 注 意 ， 由 于 在 子 查询 中 使 用 了 未 限定 的 聚集 郴 数 
COUNT， 因 而 必须 在 视图 定义 中 命名 这 些 列 。 « 


7.4.2 删除 视图 (DROP VIEW) 


FA DROP VIEW 语句 把 视图 从 数据 库 中 删除 : 
DROP VIEW ViewName [RESTRICT | CASCADE] 


branchNo 
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DROP VIEW 子 句 把 视图 的 定义 从 数据 库 中 删除 。 例 如 ， 删 除 视 图 Manger3Staff: 

DROP VIEW Manager3Staff; 

如 果 指 定 CASCADE 方式 ， 那 么 DROP VIEW 将 删除 所 有 相关 依赖 的 对 象 ， 换 句 话说 ， 
就 是 删除 所 有 引用 该 视图 的 对 象 。 这 意味 着 DROP VIEW 也 将 删除 定义 在 被 删除 视图 上 的 所 
有 视图 。 如 果 指 定 RESTRICT 方式 ， 那 么 如 果 存 在 依赖 于 被 删除 视图 的 其 他 对 象 ，SQL 将 
不 进行 该 删除 操作 。 默 认 设置 为 RESTRICT。 


7.4.3 视图 分 解 

前 面 已 经 学 习 了 如 何 建立 和 使 用 视图 ， 现 在 进一步 说 明 如 何 处 理 对 视图 进行 的 查询 。 为 
了 说 明 视 图 分 解 的 过 程 ， 请 看 下 面 的 查询 ， 计 算 在 分 公司 B003 工作 的 每 位 员工 管理 房产 的 
数量 。 此 查询 基于 例 7.5 的 视图 StaffPropCnt: 


SELECT staffNo, cnt 

FROM StaffPropCnt 
WHERE branchNo = ‘B003 
ORDER BY staffNo; 


视图 分 解 是 将 上 面 的 查询 与 StaffPropCnt 视图 的 定义 查询 合并 。 过 程 如 下 : 

(1) 将 SELECT 列表 中 给 出 的 视图 列 名 转换 为 定义 查询 中 相应 的 列 名 。 即 : 

SELECT s.staffNo AS staffNo, COUNT(*) AS cnt 

(2) FROM 子 句 中 的 视图 名 可 用 定义 查询 中 相应 的 FROM 列表 代替 : 

FROM Staff s, PropertyForRent p 

(3) 用 逻辑 运算 符 AND 将 来 自用 户 查 询 的 WHERE 子 句 和 定义 查询 的 WHERE TAA 
H+, B: 

WHERE s.staffNo = p.staffNo AND branchNo = ‘B003 

(4) 从 定义 查询 复制 GROUP BY A HAVING 子 句 。 本 例 中 ， 只 使 用 了 GROUP BY 
FA: 

GROUP BY s.branchNo, s.staffNo 

(5) 最 后 ， 从 用 户 查 询 复 制 ORDER BY 子 句 ， 同 时 将 视图 的 列 名 转换 为 定义 查询 的 
列 名 : 

ORDER BY s.staffNo 

(6) 最 后 合并 查询 变 为 : 


SELECT s.staffNo AS staffNo, COUNT(*) AS cnt 
FROM Staff s, PropertyForRent p 

WHERE s.staffNo = p.staffNo AND branchNo = B003” 
GROUP BY s.branchNo, s.staffNo 

ORDER BY s:staffNo; 


查询 结果 如 表 7-6 所 示 。 


7.4.4 视图 的 局 限 性 
ISO 标准 对 创建 和 使 用 视图 施加 了 一 些 重要 的 限定 ， 


表 7-6 视图 分 解 后 的 查询 结果 表 
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尽管 各 种 实现 版 本 有 相当 大 的 不 同 。 


e 如 果 视 图 中 某 个 列 是 基于 聚集 函数 的 ， 那 么 在 访问 该 视图 的 查询 语句 中 ,该 列 只 能 
列 不 能 出 现在 WHERE 子 句 中 ， 也 不 能 作为 任何 聚集 函数 的 参数 。 例 如 ， 例 7.5 中 
视图 StaffPropCnt 有 一 个 列 cnt 是 基于 聚集 函数 COUNT 的 。 那 么 下 面 的 查询 将 会 
失败 : 

SELECT COUNT (cnt) 

FROM StaffPropCnt; 


出 现在 SELECT 和 ORDER BY 子 句 里 。 具 体 地 说 ， 在 基于 该 视图 的 查询 语句 中 ， 该 
也 会 失败 : 


SELECT * 


因为 对 列 cnt AT RRM, MIAH VEAP RR RR. FA, FEAA 
FROM StaffPropCnt 


WHERE cnt > 2; 


7.4.5 视图 的 可 更 新 性 


因为 在 WHERE 子 句 中 使 用 了 视图 的 列 cnt， 该 列 是 由 聚集 函数 导出 的 。 
© 分 组 视图 从 来 就 不 能 与 基 表 或 视图 连接 。 例 如 ， 视 图 StaffPropCnt 是 一 个 分 组 视图 ， 
所 以 任何 试图 将 这 个 视图 与 另 一 个 表 或 视图 连接 的 操作 都 会 失败 。 


INSERT INTO StaffPropCnt 


对 一 个 基 表 的 所 有 更 新 都 会 立即 反映 到 包含 这 个 基 表 的 所 有 视图 中 。 同 样 ， 我 们 可 
StaffPropCnt。 考 虑 一 下 ， 如 果 试 图 将 包含 分 公司 B003、 员 工 SG5 和 管理 两 处 房产 这 么 一 
VALUES (‘B003’, ‘SG5’, 2); 


能 期 望 当 一 个 视图 被 更 新 时 ， 基 表 也 将 反映 这 种 变化 。 然 而 ， 再 看 一 下 例 7.5 中 的 视图 
个 记录 插 人 视图 中 将 会 发 生 什么 情况 ， 插 人 语句 如 下 : 


数量 : 


为 此 ， 不 得 不 往 表 PropertyForRent 中 插入 两 个 记录 ， 表 明 员 工 SG5 管理 的 是 哪 两 处 房 
产 。 然 而 ， 现 在 只 知道 该 员工 管理 着 两 处 房产 ， 并 不 知道 它们 具体 是 什么 。 换 名 话说， 并 


AS SELECT s.branchNo, s.staffNo, p.propertyNo 
FROM Staff s, PropertyForRent p 
WHERE s.staffNo = p.staffNo; 
下 插入 记录 : 


不 知道 表 PropertyForRent 相应 的 主 关键 字 值 。 如 果 改 变 视 图 定义 并 用 实际 的 房产 编号 代替 
CREATE VIEW StaffPropList (branchNo, staffNo, propertyNo) 

INSERT INTO StaffPropList 

VALUES (‘B003’, ‘SG5’, ‘PG19’) 


这 个 插入 操作 仍然 存在 问题 


和 staffNo 外 所 有 列 都 不 允许 为 空 (参见 例 7.1 )。 然 而 ， 视 图 StaffPropList 中 并 不 包括 表 
充 要 条 件 为 : 


， 因 为 给 出 表 PropertyForRent 的 定义 时 ， 除 了 postcode 
PropertyForRent 中 除了 房产 编号 以 外 的 其 他 列 ， 从 而 无 法 提供 那些 非 空 的 列 值 。 


ISO 标准 指出 视图 在 符合 标准 的 系统 中 才 一 定 是 可 更 新 的 。ISO 标准 给 出 视图 可 更 新 的 
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e 没有 指定 DISTINCT， 即 重复 元 组 未 从 查询 结果 中 消除 。 
o 定义 查询 的 SELECT 列表 中 的 每 个 元 素 均 为 列 名 (而 不 是 常量 、 表 达 式 或 聚集 函 
数 )， 且 列 名 出 现 的 次 数 不 多 于 一 次 。 
e FROM 子 句 只 指定 一 个 表 ， 即 视图 只 有 一 个 源 表 且 用 户 对 该 表 有 要 求 的 权限 。 如 果 
源 表 本 身 就 是 一 个 视图 ， 那 么 该 视图 必须 满足 这 些 条 件 。 因 此 ， 排 除了 基于 连接 、 
并 (UNION)、 交 (INTERSECT) 或 差 (EXCEPT) 操作 的 所 有 视图 。 
。 WHERE 子 句 不 能 包括 任何 引用 了 FROM 子 句 中 的 表 的 和 侍 套 SELECT 操作 。 
e 定义 查询 中 不 能 有 GROUP BY 或 HAVING 子 句 。 
另外 ， 添 加 到 视图 中 的 每 一 行 都 不 能 违反 基 表 的 完整 性 约束 。 例 如 ， 如 果 通 过 视图 插入 
一 个 新 行 ， 则 视图 中 没有 涉及 的 列 可 以 设置 为 空 ， 但 这 不 能 违反 基 表 的 NOT NULL 完整 性 
约束 。 这 些 限制 中 蕴涵 的 基本 概念 为 ; 


可 更 新 视图 | 为 了 使 视图 可 更 新 ， 对 于 任何 一 个 行 或 列 ，DBMS 必须 都 能 追溯 到 其 源 表 中 
相应 的 行 或 列 。 


7.4.6 WITH CHECK OPTION 


视图 中 的 行 均 满足 定义 查询 中 的 WHERE 条 件 。 如 果 某 行 被 修改 后 不 再 满足 这 种 条 件 ， 
那么 它 应 当 从 视图 中 去 除 。 相 似 地 ， 当 对 视图 进行 插入 和 更 新 时 ， 如 果 有 新 行 满足 WHERE 
条 件 ， 那 么 这 些 新 行 便 会 出 现在 视图 中 。 进 入 或 离开 视图 的 行 称 为 迁移 行 。 

通常 来 说 ，CREATE VIEW 语句 中 的 WITH CHECK OPTION 子 句 用 于 禁止 行 迁移 出 视 
图 。 可 选修 饰 词 LOCAL/CASCADED 应 用 于 层次 视图 ， 即 由 视图 导出 的 视图 。 这 种 情况 下 ， 
如 果 指 定 了 WITH LOCAL CHECK OPTION, 那么 在 该 视图 或 由 该 视图 直接 或 间接 导出 的 
视图 上 进行 行 插入 或 更 新 操作 时 ， 不 允许 行 迁移 出 视图 ， 除 非 该 行 也 迁移 出 底层 视图 或 表 。 
如 果 指 定 了 WITH CASCADED CHECK OPTION (默认 设置 )， 那 么 在 该 视图 或 由 该 视图 直 
接 或 间接 导出 的 视图 上 进行 行 插入 或 更 新 操作 时 ， 都 不 允许 行 迁移 出 该 视图 。 

这 个 特性 非常 有 用 ， 它 使 得 用 具有 该 特性 的 视图 比 用 基 表 更 具 吸 引力 。 当 视图 中 
INSERT 和 UPDATE 语句 违反 了 定义 查询 的 WHERE 条 件 时 ， 操 作 即 被 拒绝 。 对 数据 库 强 
加 这 种 约束 有 助 于 保持 数据 的 完整 性 。WITH CHECK OPTION 仅 能 应 用 于 前 面 章 节 定 义 的 
可 更 新 视图 。 


| 例 7.6 >} WITH CHECK OPTION 
重新 考虑 例 7.3 创建 的 视图 : 


CREATE VIEW Manager3Staff 
AS SELECT * 

FROM Staff 

WHERE branchNo = ‘B003 
WITH CHECK OPTION; 


它 有 如 表 7-3 所 示 的 虚 表 。 如 果 试 图 将 某 行 的 分 公司 编号 B003 更 新 为 B005， 例 如 : 


UPDATE Manager3Staff 
SET branchNo = ‘B005’ 
WHERE staffNo = ‘SG37’; 
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那么 视图 定义 中 的 WITH CHECK OPTION 子 句 使 得 该 操作 被 拒绝 ， 因 为 它 将 导致 一 行 
从 原水 平视 图 中 移出 。 类 似 地 ， 如 果 企 图 在 该 视图 中 插入 下 面 的 行 : 
INSERT INTO Manager3Staff 


VALUES(‘SL15’, ‘Mary’, ‘Black’, ‘Assistant’, ‘F’, DATE’ 1967-06-21’, 8000, “B002’); 


视图 定义 中 的 WITH CHECK OPTION 子 句 阻止 该 行 插入 到 基 表 Sta 任 中 ， 并 且 根 本 不 
会 在 视图 中 出 现 (因为 分 公司 B002 不 是 视图 的 一 部 分 )。 
现在 考虑 这 种 情况 ， 视 图 Manager3Staff 不 是 直接 基于 表 Staff 定义 ， 而 是 基于 Staff 的 
男 一 个 视图 : 
CREATE VIEW LowSalary CREATE VIEW HighSalary CREATE VIEW Manager3Staff 
AS SELECT * AS SELECT * AS SELECT * 
FROM Staff FROM LowSalary FROM HighSalary 
WHERE salary > 9000; WHERE salary > 10000 WHERE branchNo = *B003’; 
WITH LOCAL CHECK OPTION; 
如 果 试 图 更 新 视图 Manager3Staff: 
UPDATE Manager3Staff 
SET salary = 9500 
WHERE staffNo = ‘SG37’; 


CHECK OPTION 创建 视图 。 


该 更 新 将 会 失败 ， 因 为 更 新 会 引起 一 行 从 视图 HighSalary 中 去 除 ， 但 却 不 会 从 视图 
8000， 操 作 将 会 成 功 ， 因 为 该 行 也 会 从 LowSalary 中 去 除 。 然 而 ， 如 果 视 图 HighSalary 定 


LowSalary 中 去 除 (而 视图 HighSalary 由 视图 LowSalary th), We AE oe LAN 


进行 了 总 结 


一 些 缺 点 。 本 节 将 简单 讨论 视图 的 优点 和 缺点 ， 表 7-7 
LASI 


义 中 给 出 WITH CASCADED CHECK OPTION， 则 无 论 设置 工资 为 9500 还 是 8000， 这 种 更 
7.4.7 视图 的 优 缺 点 
限制 某 些 用 户 仅 能 访问 视图 而 不 能 直接 访问 基 表 有 许多 好 人 处。 遗憾 的 是 ，SQL 视图 也 有 


新 都 将 被 拒绝 。 所 以 ， 为 了 确保 不 出 现 这 样 的 反常 情况 ， 通 常 需要 使 用 WITH CASCADED 


« 
对 在 一 台独 立 PC 上 运行 的 DBMS， 视 图 通常 作为 
一 种 便利 机 制 ， 简 化 数据 库 的 请 求 。 然 而 ， 在 多 用 户 









表 7-7 SQL 中 视图 优 缺 点 的 总 结 
数据 独立 性 
实时 性 





DBMS 中 ， 视 图 在 定义 数据 库 结构 和 强制 完整 性 安全 
性 方面 扮演 着 重要 角色 。 视 图 的 主要 优点 描述 如 下 。 





提高 了 安全 性 


降低 了 复杂 性 
数据 独立 性 。 视 图 可 给 出 一 致 的 、 不 变 的 数据 库 


结构 局 限 性 


性 能 开销 


方便 
结构 描述 ， 即 使 底层 源 表 发 生 了 变化 (例如 ， 添 加 或 删 


除 列 、 改 变 了 联系 、 表 被 拆 分 、 重 构 或 重 命名 )。 如 果 


用 户 化 





数据 完整 性 








表 中 添加 或 删除 列 ， 且 这 些 列 不 是 视图 所 需要 的 ， 那么 视图 定义 就 不 需要 改变 。 如 果 现 有 表 
被 重 构 或 拆 分 ， 可 定义 视图 使 用 户 仍 能 继续 看 到 旧 表 。 对 于 拆 分 表 的 情况 ， 假 如 拆 分 的 方式 
是 源 表 可 以 重 构 ， 那 么 旧 表 可 以 用 新 表 的 连接 所 定义 的 视图 表示 。 可 以 在 两 个 新 表 中 都 放置 
主 关 键 字 来 确保 这 一 点 。 假 如 原 有 表 Client 如 下 : 
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Client (clientNo, fName, IName, telNo, prefType, maxRent, eMail) 


将 其 拆 分 为 两 个 新 表 : 


ClientDetails (clientNo, fName, IName, telNo, eMail) 
ClientReats (clientNo, preffype, maxRent) 


用 户 和 应 用 程序 仍 可 以 使 用 旧 表 的 结构 访问 数据 ， 通 过 ClientDetails 与 ClientReqts A 
然 连接 ，ClientNo 作为 连接 列 定 义 出 视图 Client， 如 同 旧 表 被 重新 建立 : 

CREATE VIEW Client 

AS SELECT cd.clientNo, fName, IName, telNo, prefType, maxRent, eMail 

FROM ClientDetails cd, ClientReats cr 
WHERE cd.clientNo = cr.clientNo; 

实时 性 。 定 义 查询 中 任何 基 表 的 改变 都 会 立即 反映 到 视图 中 。 

提高 了 安全 性 。 每 个 用 户 访 问 数据 库 的 权限 限定 为 一 小 组 视图 ， 这 些 视图 包括 用 户 可 使 
用 的 数据 ， 从 而 限制 和 控制 了 用 户 对 数据 库 的 访问 。 

降低 了 复杂 性 。 视 图 可 以 简化 查询 ， 通 过 把 多 表 中 得 到 的 数据 放 到 单 表 中 ， 将 多 表 查 询 
转换 为 单 表 查询 。 

方便 。 视 图 为 用 户 提供 了 极 大 的 方便 ， 因 为 提供 给 用 户 的 数据 仅仅 是 用 户 想 看 到 的 那 部 
分 数据 库 内 容 。 从 用 户 的 观点 来 说 ， 也 降低 了 复杂 性 。 

用 户 化 。 视 图 提供 了 定制 数据 库 呈 现形 式 的 一 种 方法 ， 目 的 是 同一 个 底层 基 表 可 以 被 不 
同 的 用 户 以 不 同 的 方式 查看 。 

数据 完整 性 。 如 果 使 用 了 CREATE VIEW 语句 的 WITH CHECK OPTION 子 句 ， 则 SQL 
就 可 确保 不 满足 定义 查询 中 WHERE 子 句 的 任何 行 不 会 通过 视图 加 入 基 表 ， 这 样 就 确保 了 视 
图 的 完整 性 。 
缺点 

尽管 视图 提供 了 不 少 的 优点 ， 但 也 有 一 些 缺 点 。 

更 新 局 限 性 。 在 7.4.5 节 中 已 经 阐述 过 ， 在 一 些 情况 下 视图 不 可 更 新 。 

结构 局 限 性 。 视 图 的 结构 是 在 建立 时 确定 的 。 如 果 定 义 查询 是 SELECT * FROM... 形式 
的 ， 那 么 星 号 (*) 代表 视图 创建 时 基 表 的 列 。 如 果 列 是 以 后 加 入 基 表 的 ， 那么 就 不 会 出 现 
在 视图 中 ， 除 非 删 除 视图 再 重建 。 

性 能 开销 。 使 用 视图 会 带 来 一 定 的 性 能 开销 。 某 些 情况 下 ， 这 种 开销 可 以 忽略 ; 男 一 些 
情况 下 ， 性 能 开销 是 严重 的 问题 。 例 如 ， 通 过 复杂 多 表 查 询 定义 的 视图 可 能 会 用 很 长 的 时 间 
处 理 查询 过 程 ， 因 为 每 次 视图 访问 时 视图 分 解 必 须 同 时 连接 多 个 表 。 视 图 分 解 需要 额外 的 计 
算 机 资源 。 下 一 节 将 简单 讨论 采用 何 种 方法 殉 服 视图 的 这 些 缺 点 。 


7.4.8 视图 物化 


在 7.4.3 节 中 讨论 过 基于 视图 的 查询 的 一 种 处 理 办 法 ， 即 将 查询 转换 为 对 基 表 的 查询 。 
这 种 方法 的 一 个 缺点 是 要 花费 一 定 的 时 间 进 行 视图 分 解 ， 特 别 是 当 视 图 被 频繁 访问 时 。 男 一 
种 方法 称 为 视图 物化 ， 即 把 第 一 次 访问 视图 的 结果 存储 为 数据 库 的 临时 表 。 这 样 ， 基 于 物化 
视图 的 查询 比 每 次 重新 计算 视图 要 快 得 多 。 当 查询 频 索 且 视 图 复杂 ， 以 至 于 每 次 查询 都 计算 
视图 不 现实 时 ， 这 种 速度 上 的 差异 在 应 用 中 就 显得 非常 重要 了 。 
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中 。 完 整 性 约束 检查 和 查询 优化 也 得 益 于 物化 视图 。 这 种 方法 的 困难 之 处 在 于 基 表 更 新 的 同 
时 还 要 保证 视图 的 实时 性 。 更 新 基 表 的 同时 引起 物化 视图 更 新 的 过 程 称 为 视图 维护 。 视 图 维 
护 基 本 的 目的 是 对 视图 进行 必要 的 改变 ， 以 保持 视图 的 最 新 性 。 为 了 说 明 这 个 问题 ， 请 看 下 
面 的 视图 : 

CREATE VIEW StaffPropRent (staffNo) 

AS SELECT DISTINCT staffNo 


FROM PropertyForRent - 
WHERE branchNo = ‘B003’ AND rent > 400; 


结果 数据 见 表 7-8。 如 果 想 向 表 PropertyForRent 中 插入 列 rent<400 W147, ARAMA AZ 
改变 。 如 果 向 表 PropertyForRent 中 插入 行 ('`PG4'，…， 表 7-8 视图 StaffPropRent 的 数据 
£59. “COED” “Sie "0039 me aoe ts ee ee He 
在 物化 视图 中 。 可 是 如 果 回 表 PropertyForRent 中 插入 行 
('PG54'，…，450，'CO89'，'SG37'，'B003')， 那 么 物化 视图 
不 会 增加 新 行 ， 这 是 因为 行 SG37 已 经 存在 。 注 意 ， 在 这 
三 种 情况 下 ， 决 定 一 个 行 是 否 插 入 物化 视图 并 不 需要 访问 基 表 PropertyForRent。 

如 果 和 希望 从 表 PropertyForRent 中 删除 行 ('PG24', =, 550, 'CO40', 'SG19', 'B003'), 
那么 对 应 行 也 会 从 物化 视图 中 删除 。 如 果 和 希望 从 表 PropertyForRent 中 删除 行 ('PG54', = 
450，'CO89'，'SG37'，'B003')， 那 么 物化 视图 中 对 应 于 SG37 的 行 不 会 被 删除 ， 因 为 基 表 中 
SG37 还 存在 对 应 于 房产 PG21 的 一 行 。 在 这 两 种 情况 下 ， 决 定 在 物化 视图 中 是 否 删 除 或 保 
留 行 需要 访问 基本 表 PropertyForRent。 对 于 物化 视图 的 更 加 完整 的 讨论 ， 可 参阅 Gupta and 
Mumick ( 1999 ) 。 


75 事务 


ISO 标准 基于 COMMIT 和 ROLLBACK 两 个 SQL 语句 定义 的 事务 模型 。 大 多 数 (但 并 
非 全 部 ) 商品 化 SQL 实现 都 符合 这 个 模型 ， 该 模型 基于 DBMS IBM DB2。 事 务 是 由 一 个 或 
多 个 SQL 语句 组 成 的 逻辑 工作 单元 ， 通 过 恢复 机 制 可 以 保证 其 原子 性 。ISO 标准 指出 ， 当 
用 户 或 程序 执行 事务 初始 化 SQL 语句 (例如 SELECT, INSERT, UPDATE) HY, SQL 事务 
自动 开始 。 事 务 在 其 结束 之 前 所 进行 的 变化 对 其 他 并 发 执行 的 事务 均 不 可 见 。 结 束 事务 有 四 
种 方式 : 
© COMMIT 语句 成 功 提交 事务 ， 并 使 数据 库 的 变化 持久 化 。COMMIT 语句 之 后 由 事务 
初始 化 语句 开始 下 一 个 新 事务 。 
èe ROLLBACK 语句 撤销 事务 ， 回 退 到 事务 执行 前 。ROLLBACK 语句 之 后 由 事务 初始 
化 语句 开始 下 一 个 新 事务 。 
e 对 于 程序 式 SQL (参见 附录 IJ)， 程 序 成 功 终止 意味 着 最 后 一 个 事务 成 功 结束 ， 即 使 
不 执行 COMMIT 语句 。 
e 对 于 程序 式 SQL， 不 正常 的 程序 终止 撤销 事务 。 
SQL FZ K ERE (参见 22.4 节 )。SET TRANSACTION 语句 允许 用 户 配 置 事 务 的 某 
些 特性 。 该 语句 的 基本 格式 如 下 : 


staffNo 
SG37 
SG14 
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SET TRANSACTION 

[READ ONLY | READ WRITE] | 

[ISOLATION LEVEL READ UNCOMMITTED | READ COMMITTED | 
REPEATABLE READ | SERIALIZABLE] 


READ ONLY 和 READ WRITE 修饰 符 表明 事务 是 只 读 的 还 是 包括 读 和 写 两 种 操作 。 硅 
什么 修饰 符 都 没有 ， 默 认 设置 为 READ WRITE (除非 隔离 级 为 READ UNCOMMITIED)。 
也 许 有 点 混乱 ,但 READ ONLY 却 允 许 事务 对 临时 表 进 行 INSERT、UPDATE 和 DELETE 
操作 ( 仅 限 于 临时 表 )。 

隔离 级 表明 事务 执行 过 程 中 允许 与 其 他 事务 交互 的 程度 。 针 对 下 面 三 种 可 防止 的 现象 ， 
K 7-9 列 出 了 每 个 隔离 级 允许 违反 的 可 串 行 性 : 

e 污 读 。 事 务 读 取 被 其 他 至 今 未 提交 事务 写 过 的 数据 。 

e 不 可 重读 。 事 务 重读 先前 已 读 过 的 数据 时 ， 该 数据 却 被 已 提交 事务 在 这 两 次 读 之 间 

修改 或 删除 过 。 

e 幻 读 。 事 务 执行 一 个 查询 ， 获 得 满足 特定 查询 条 件 的 多 行 数据 。 当 事务 稍 后 重新 执 

行 该 查询 时 ， 会 返回 增加 的 行 ， 增 加 的 行 是 由 其 他 已 提交 事务 在 这 期 间 插入 的 。 


表 7-9 隔离 级 允许 违反 可 串 行 性 的 情况 


隔离 级 
READ UNCOMMITTED 


se | rme 


REPEATABLE READ 


Z (OS | SAY 


SERIALIZABLE 


只 有 SERIALIZABLE 隔离 级 是 安全 的 ， 它 产生 的 是 可 串 行 化 调度 。 对 于 其 他 隅 离 级 ， 
程序 员 需 使 用 DBMS 提供 的 机 制 以 保证 可 串 行 性 。 第 22 章 提 供 有 关 事务 和 可 串 行 性 的 其 他 
信息 。 
立即 完整 约束 与 延迟 完整 约束 

在 某 些 情况 下 ， 并 不 希望 在 每 个 SQL 语句 执行 后 立即 进行 完整 性 约束 检查 ， 而 希望 
延迟 到 事务 提交 时 进行 完整 性 约束 检查 。 约 束 可 能 定义 为 INITIALLY IMMEDIATE 或 
INITIALLY DEFERRED， 表 明 每 个 事务 开始 时 采用 哪 一 种 约束 模式 。 前 一 种 情况 下 ， 也 
可 以 用 标识 符 [NOT] DEFERRABLE 指定 模式 以 后 是 否 可 改变 。 默 认 模 式 为 INITIALLY 
IMMEDIATE, 

SET CONSTRAINTS 语句 用 于 对 当前 事务 设置 约束 模式 。 语 句 格式 如 下 : 


SET CONSTRAINTS 
{ALL | constraintName [, . . .]} {DEFERRED | IMMEDIATE} 


76 自主 访问 控制 


在 2.4 节 中 曾 提 到 ，DBMS 系统 应 该 提供 一 种 机 制 ， 确 保 只 有 授权 用 户 才 能 够 访问 数据 
库 。 现 代 DBMS 通常 提供 下 面 一 种 或 两 种 授权 机 制 。 
e 自主 访问 控制 。 每 个 用 户 被 授予 对 特定 的 数据 库 对 象 的 适当 的 访问 权利 (或 权限 )。 
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典型 情况 是 ， 当 用 户 创 建 一 个 对 象 时 即 获得 某 些 权限 ， 并 能 按 他 们 的 想法 授予 部 分 
或 全 部 权限 给 其 他 用 户 。 这 种 授权 机 制 虽 然 灵 活 ， 但 未 授权 的 用 户 可 能 会 伪装 成 授 
权 用 户 来 窃取 人 敏感 数据 。 

© 强制 访问 控制 。 每 个 数据 库 对 象 被 赋予 特定 分 级 (例如, 绝密、 秘密 、 机 密 、 不 保 

密 )， 并 且 每 个 主体 (例如 ， 用 户 、 程 序 ) 被 赋予 指定 的 许可 证 级 别 。 分 级 形成 一 个 
严格 的 顺序 (绝密 二 机 密 二 秘密 二 不 保密 )， 主 体 需 要 必要 的 许可 证 级 别 来 读 写 数 据 库 
对 象 。 这 种 多 级 安全 机 制 对 政府 、 军 队 和 公用 应 用 软件 非常 重要 。 最 常用 的 强制 访问 
控制 模型 是 Bell-LaPadula (Bell and LaPadula，1974 )， 我 们 将 在 第 20 章 深 入 讨论 。 

SQL 通过 GRANT 和 REVOKE 语句 来 文 持 目 主 访问 控制 。 该 机 制 基 于 授权 标识 符 、 所 
有 权 和 权限 的 概念 ， 这 些 将 在 下 面 讨论 。 
授权 标识 符 和 所 有 权 

授权 标识 符 是 SQL 用 于 辨别 用 户 的 一 般 标 识 符 。 每 个 数据 库 用 户 都 由 数据 库 管理 员 分 
配 一 个 授权 标识 符 。 为 了 安全 起 见 ， 标 识 符 通 常 都 和 一 个 密码 相关 联 。DBMS 执行 的 每 个 
SQL 语句 都 是 代表 某 个 用 户 的 。 可 用 授权 标识 符 来 确定 用 户 可 访问 哪些 数据 库 对 象 ， 以 及 
对 哪些 对 象 能 进行 什么 操作 。 

SQL 中 创建 的 每 个 对 象 都 有 一 个 所 有 者 。 所 有 者 就 是 创建 该 对 象 所 属 的 模式 时 
AUTHORIZATION 子 句 定 义 的 授权 标识 符 (参见 7.3.1 节 )。 最 初 只 有 所 有 者 知道 对 象 存在 ， 
并 能 对 其 进行 任何 操作 。 
权限 

权限 是 指 允 许 用 户 对 指定 基 表 或 视图 进行 的 操作 。ISO 标准 定义 的 权限 有 : 

SELECT: 检索 表 中 数据 的 权限 。 

INSERT: 向 表 中 搬入 新 行 的 权限 。 

UPDATE: 更 新 表 中 的 行 的 权限 。 

DELETE: 删除 表 中 的 行 的 权限 。 

REFERENCES: 完整 性 约束 中 引用 指定 表 中 列 的 权限 。 

USAGE : 使 用 域 、 序 列 、 字 符 集 和 转变 规则 。 本 书 并 不 讨论 序列 、 字 符 集 和 转变 规 
则 ， 有 兴趣 的 读者 可 参看 Cannan and Otten ( 1993 ) 。 

INSERT 和 UPDATE 权限 可 以 限制 表 中 指定 的 列 ， 人 允许 改变 这 些 列 但 不 允许 改变 其 他 
列 。 相 似 地 ，REFERENCES 权限 可 以 限制 表 中 指定 的 列 ， 人 允许 在 约束 中 引用 这 些 列 ， 如 检 
查 约束 和 外 部 关键 字 约 束 ， 但 不 允许 引用 其 他 列 。 

当 用 户 用 CREATE TABLE 语句 创建 表 时 ， 他 上 自动 成 为 表 的 所 有 者 并 获得 对 表 的 所 有 权 
限 。 其 他 用 户 对 这 个 新 表 初 始 时 并 没有 任何 权限 。 为 了 允许 其 他 用 户 访问 该 表 ， 所 有 者 必须 
用 GRANT 语句 显 式 授予 他 们 访问 所 必需 的 权限 。 

当 用 户 用 CREATE VIEW 语句 创建 视图 时 ， 他 自动 成 为 视图 的 所 有 者 但 并 不 一 定 具 
有 视图 的 所 有 权限 。 创 建 视 图 时 ， 用 户 必须 具有 对 组 成 视图 的 所 有 表 的 SELECT 权限 ， 以 
及 视图 中 列 的 REFERENCES 权限 。 然 而 ， 视 图 的 所 有 者 要 想 拥 有 INSERT, UPDATE 和 
DELETE 权限 ， 则 必须 拥有 视图 中 每 个 表 的 这 些 权 限 。 


7.6.1 授予 其 他 用 户 权 限 (GRANT) 
GRANT 场 句 将 数据 库 对 象 的 权限 授予 特定 用 户 。 正 常情 况 下 ，GRANT 语句 由 表 的 所 
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有 者 授权 给 访问 数据 的 其 他 用 户 。GRANT 语句 的 格式 如 下 : 


GRANT {PrivilegeList | ALL PRIVILEGES} 
ON ObjectName 
TO {AuthorizationidList | PUBLIC} 
[WITH GRANT OPTION] 
PrivilegeList 由 下 列 用 逗号 分 开 的 一 个 或 多 个 权限 组 成 : 
SELECT 
DELETE 
INSERT [(columnName [, . . . ])] 
UPDATE [(columnName [, . . . ])] 
REFERENCES  [(columnName [, . . . ])] 
USAGE 


为 方便 起 见 ，GRANT 语句 允许 用 关键 字 ALL PRIVILEGES 授予 用 户 所 有 权限 ， 而 不 是 
分 别 授予 六 个 权限 。 关 键 字 PUBLIC 可 允许 所 有 现在 或 未 来 授权 用 户 访 问 数据 ， 而 不 局 限于 
DBMS 系统 当前 已 有 的 用 户 。ObjectName 可 以 是 基 表 、 视 图 、 域 、 序 列 或 转变 规则 的 名 字 。 

WITH GRANT OPTION 子 句 允许 AuthorizationIdList 中 的 用 户 将 他 们 拥有 的 对 指定 对 
象 的 权限 传递 给 其 他 用 户 。 如 果 这 些 用 户 传递 的 是 指定 WITH GRANT OPTION 的 权限 ， 那 
么 接收 权限 的 用 户 还 可 继续 传递 权限 给 其 他 的 用 户 。 如 果 没 有 指定 这 个 关键 字 ， 接 收 权 限 的 
用 户 就 不 能 再 传递 权限 给 其 他 用 户 。 通 过 这 种 方式 ， 对 象 所 有 者 可 严格 控制 允许 使 用 对 象 的 
用 户 和 允许 访问 的 形式 。 


| 例 7.7 D 授予 所 有 权限 
将 表 Staff 的 全 部 权限 授予 授权 标识 符 为 Manager 的 用 户 。 


GRANT ALL PRIVILEGES 

ON Staff 

TO Manager WITH GRANT OPTION; 

标识 为 Manager 的 用 户 可 以 检索 表 Staff 中 的 行 ， 插 入、 更 新 或 删除 表 中 数据 。Manager 
也 可 以 访问 表 Staff 和 任何 随后 建立 的 Sta 任 中 的 列 。 通 过 指定 关键 字 WITH GRANT OPTION, 
Manager 可 以 传递 这 些 权 限 给 其 他 用 户 。 « 


| 例 7.8 >> 授予 特定 权限 
授予 用 户 Personnel 和 Director 对 表 Staff HJ SELECT 和 对 表 的 salary 列 UPDATE 的 权限 。 


GRANT SELECT, UPDATE (salary) 

ON Staff 

TO Personnel, Director; 

这 里 没有 关键 字 WITH GRANT OPTION, iX#£ HIF Personnel 和 Director 就 不 能 再 把 这 
些 权 限 传递 给 其 他 用 户 。 « 


| 例 7.9 Ð 授予 所 有 用 户 特定 的 权限 
将 表 Branch 中 的 SELECT 权限 授予 所 有 用 户 。 


GRANT SELECT 
ON Branch 
TO PUBLIC; 
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这 里 用 PUBLIC 意味 着 所 有 用 户 (现在 和 未 来 ) 都 可 以 检索 表 Branch 的 所 有 数据 。 注 
意 ， 这 时 使 用 WITH GRANT OPTION 没有 任何 意义 ， 因 为 每 个 用 户 都 可 以 访问 表 中 数据 ， 
无 需 传递 权限 给 其 他 用 户 。 « 


7.6.2 ”撤销 用 户 权 限 (REVOKE ) 


REVOKE 语句 用 于 撤销 GRANT 语句 授予 的 权限 。REVOKE 语句 能 够 取消 前 面授 予 给 
用 户 的 所 有 或 部 分 权限 。 语 名 格式 如 下 : 

REVOKE [GRANT OPTION FOR] {PrivilegeList | ALL PRIVILEGES} 

ON ObjectName 

FROM _ {AuthorizationidList | PUBLIC} [RESTRICT | CASCADE] 

关键 字 ALL PRIVILEGES 是 指正 在 撤销 授权 的 这 个 用 户 授 予 某 一 用 户 的 所 有 权限 。 可 
选 的 子 句 GRANT OPTION FOR 人 允许 通过 GRANT 语句 中 的 WITH GRANT OPTION 传递 的 
那些 权限 被 独立 地 撤销 。 

限制 符 RESTRICT 和 CASCADE 的 意义 类 似 于 DROP TABLE 语句 (参见 7.3.3 节 )。 由 
于 创建 对 象 需要 相应 的 权限 ,那么 撤销 权限 也 就 撤销 了 创建 该 对 象 的 权力 (这样 的 对 象 称 为 
被 抛弃 )。 如 果 REVOKE 语句 导致 一 个 对 象 (比如 说 视图 ) 被 抛弃 ， 那 么 该 操作 不 能 执行 ， 
除非 指定 了 关键 字 CASCADE。 如 果 指 定 了 CASCADE, 合适 的 DROP 语句 将 用 于 删除 所 有 
被 抛弃 的 视图 、 域 、 约 柬 或 声明 。 

注意 ， 用 户 从 其 他 用 户 那 里 获得 的 权限 并 不 受 这 个 REVOKE 语句 的 影响 。 因 此 ， 如 果 
另 一 个 用 户 也 曾 授予 该 用 户 正 被 撤销 的 权限 ， 那 么 另 一 个 用 户 的 授权 使 得 该 用 户 仍 能 访问 这 
个 表 。 例 如 ， 在 图 7-1 +, HMP A 授予 用 户 B 对 表 Staff 的 INSERT 权限 ， 并 指定 了 WITH 
GRANT OPTION (步骤 1 )， 用 户 B 把 这 个 权限 传递 给 用 户 C〈 步 又 2)。 随 后 ， 用 户 C 从 用 
户 E 得 到 相同 的 权限 (步骤 3 )。 然 后 ， 用 户 C 把 这 个 权限 传递 给 用 户 D (步骤 4)。 当 用 户 
A 撤销 用 户 B 的 INSERT 权限 时 (步骤 5)， 用 户 C 的 权限 并 未 被 撤销 ,因为 用 户 C 也 从 用 
户 E 得 到 了 相应 权限 。 如 果 用 户 E 未 曾 赋予 用 户 C 权限 ， 那 么 这 个 撤销 权限 操作 将 会 级 联 
地 作用 到 用 户 C 和 用 户 D。 


ui, 








@ GRANT INSERT 
ON 
WITH GRANT OPTION 


(3) GRANT INSERT 


ON Staff 
WITH GRANT OPTION 


图 7-1 REVOKE 的 影响 
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| 例 7.10 >> 撤销 所 有 用 户 的 特定 权限 


取消 所 有 用 户 对 表 Branch 的 SELECT 权限 。 


REVOKE SELECT 
ON Branch 
FROM PUBLIC; « 


| 例 7.11 >> 撤销 给 定 用 户 的 特定 权限 


WH T Director 的 关于 表 Staff 的 所 有 权限 。 


REVOKE ALL PRIVILEGES 
ON Staff 
FROM Director; 


这 个 语句 等 价 于 REVOKE SELECT...， 因 为 这 是 Director 被 赋予 的 唯一 权限 。 « 


本 章 小 结 


ISO 标准 提供 八 种 基本 数据 类 型 : 布尔 、 字 符 、 位 、 定 点 数 、 浮 点 数 、 日 期 时 间 、 间 隅 和 字符 /二 
进 制 大 对 象 。 

SQL DDL 语句 用 于 定义 数据 库 对 象 。CREATE 和 DROP SCHEMA 语句 用 于 创建 和 删除 模式 ， 
CREATE, ALTER 和 DROP TABLE 语句 用 于 创建 、 更 新 和 删除 表 ，CREATE 和 DROP INDEX if 
句 用 于 创建 和 删除 索引 。 

ISO SQL 标准 在 CREATE 和 ALTER TABLE 语句 中 提供 子 句 来 定义 下 列 完整 性 约束 : 必须 有 
值 的 数据 、 域 约束 、 实 体 完整 性 、 引 用 完整 性 和 一 般 性 约束 。 必 须 有 值 的 数据 用 NOT NULL ff 
定 。 域 约束 可 用 CHECK 子 句 指定 或 用 CREATE DOMAIN 语句 定义 域 。 主 关键 字 可 用 PRIMARY 
KEY 子 句 来 定义 ， 也 可 用 NOT NULL 和 UNIQUE 组 合 的 候选 关键 字 来 定义 。 外 部 关键 字 应 该 用 
FOREIGN KEY 子 句 定义 ， 并 用 ON UPDATE 和 ON DELETE 子 句 指定 更 新 和 删除 规则 。 一 般 性 约 
束 可 用 CHECK 和 UNIQUE 子 句 定义 ,也 可 以 用 CREATE ASSERTION 语句 声明 。 
视图 是 一 个 虚 表 ， 表 示 一 个 或 多 个 基 表 或 视图 中 列 、 行 或 列表 达 式 的 子 集 。 创 建 视图 时 使 用 
CREATE VIEW 语句 给 出 定义 查询 。 它 不 必 是 实际 的 存储 表 ， 可 在 每 次 访问 时 被 创建 。 

视图 可 用 于 简化 数据 库 结构 ， 使 查询 更 加 容易 。 它 也 可 以 用 于 保护 特定 列 或 行 免 受 未 授权 用 户 访 
问 。 并 不 是 所 有 视图 都 是 可 更 新 的 。 

视图 分 解 就 是 将 对 视图 的 查询 和 用 于 视图 定义 的 查询 合并 ， 统 一 转换 为 对 底层 基 表 的 查询 。 每 次 
DBMS 进行 视图 查询 时 都 必须 进行 视图 分 解 。 一 种 可 选 的 方法 称 为 视图 物化 ， 即 把 视图 第 一 次 查询 
时 的 结果 存储 为 数据 库 中 的 临时 表 。 因 此 基于 物化 视图 的 查询 比 每 一 次 重新 计算 视图 快 得 多 。 物 化 
视图 的 缺点 在 于 需 实时 维持 临时 表 的 一 致 性 。 

COMMIT 语句 标志 事务 成 功 结束 ， 所 有 数据 库 的 变化 都 已 持久 化 ,。 ROLLBACK 语句 表示 事务 失败 ， 
所 有 对 数据 库 的 改变 都 将 撤销 。 

SQL 访问 控制 建立 在 授权 标识 符 、 所 有 权 和 权限 的 概念 上 。 授 权 标 识 符 由 数据 库 管 理 员 分 配给 数 
据 库 用 户 ， 以 标识 用 户 身 份 。SQL 中 创建 的 每 个 对 象 都 有 一 个 所 有 者 。 所 有 者 可 用 GRANT 语句 传 
递 权 限 给 其 他 用 户 ， 可 用 REVOKE 语句 撤销 传递 的 权限 。 可 以 传递 的 权限 有 USAGE, SELECT, 
DELETE、INSERT、UPDATE 和 REFERENCES。 后 面 三 种 可 以 限定 到 具体 列 。 用 户 可 以 使 用 
WITH GRANT OPTION 子 句 允许 接受 权限 的 用 户 继续 传递 权限 ， 并 可 用 GRANT OPTION FOR F 
句 撤销 权限 。 
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思考 题 


7.1 
7.2 
7.3 
7.4 
S 
7.6 
7.7 
7.8 
7.9 


描述 SQL 中 的 八 种 基本 数据 类 型 。 
讨论 完整 性 增强 特性 (EF) 的 功能 和 重要 性 。 
讨论 CREATE TABLE 的 每 个 子 句 。 

讨论 视图 的 优点 和 缺点 。 

描述 视图 分 解 的 工作 过 程 。 


需要 哪些 限制 来 确保 视图 是 可 更 新 的 ? 


什么 是 视图 物化 ?视图 物化 在 哪些 方面 优 于 视图 分 解 ? 
描述 自主 和 强制 访问 控制 的 不 同 ，SQL 支持 哪 种 类 型 的 控制 机 制 ? 
描述 SQL 中 访问 控制 机 制 是 如 何 工作 的 。 


习题 
使 用 第 4 章 练习 中 的 关系 模型 回答 下 列 问题 。 


7.10 
PAL 


7.12 


R13 
7.14 
ri the 
7.16 
TAF 


使 用 SQL 的 完整 性 增强 特性 创建 表 Hotel, 

使 用 SQL 的 完整 性 增强 特性 和 下 面 的 约束 条 件 创 建 表 Room Booking 和 Guest. 

(a) 类 型 必须 为 Single、Double 和 Family 中 的 一 类 。 

(b) 价格 必须 在 10 英镑 到 100 英镑 之 间 。 

(c) roomNo 必须 在 1 到 100 之 间 。 

(d) dateFrom 和 dateTo 必须 大 于 今天 的 日 期 。 

(e) 相同 房间 不 能 预订 两 次 。 

(f) 相同 客人 不 能 重复 预订 。 

创建 另 一 个 和 表 Booking 具有 相同 结构 的 表 ， 用 于 保存 归档 记录 。 用 INSERT 语 句 将 表 
Booking 中 2013 年 1 月 1 日 之 前 登记 的 记录 复制 到 归档 记录 表 中 。 从 表 Booking 中 将 2013 年 1 
月 1 日 之 前 所 有 登记 删除 。 

创建 一 个 视图 ， 包 括 酒店 名 字 和 居住 在 酒店 中 的 客人 名 字 。 

创建 一 个 视图 ， 包 括 格 罗 夫 纳 酒店 的 每 个 客人 的 账户 。 

给 用 户 Manager 和 Director 访问 视图 的 所 有 权限 ， 并 允许 他 们 继续 把 这 些 权限 传递 给 其 他 用 户 。 
给 用 户 Accounts 访问 视图 的 SELECT 权限 ， 然 后 取消 该 用 户 的 这 个 权限 。 

思考 下 列 基 于 Hotel 模式 的 视图 : 


CREATE VIEW HotelBookingCount (hotelNo, bookingCount) 

AS SELECT h.hotelNo, COUNT(*) 
FROM Hotel h, Room r, Booking b 
WHERE h.hotelNo = r.hoteINo AND r.roomNo = b.roomNo 
GROUP BY h.hotelNo; 


对 于 下 面 每 一 个 查询 ， 陈 述 该 查询 是 否 有 效 ， 且 对 于 有 效 查 询 说 明 该 查询 如 何 映射 为 对 基 表 的 
查询 。 


(a) SELECT * 

FROM HotelBookingCount; 
(b) SELECT hotelNo 

FROM HotelBookingCount 
(c) WHERE hotelNo =’H001’; 

SELECT MIN(bookingCount) 
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FROM HotelBookingCount: 
(d) SELECT COUNT(*) 
FROM HotelBookingCount; 
(e) SELECT hotelNo 
FROM HotelBookingCount 
WHERE bookingCount > 1000; 
(f) SELECT hotelNo 
FROM HotelBookingCount 
ORDER BY bookingCount; 


7.19 假设 还 有 一 个 供应 商 表 
Supplier (SupplierNo. partNo, price) 
以 及 视图 SupplierParts ， 该 视图 包括 至 少 一 个 供应 商 提供 的 各 种 零件 号 : 


CREATE VIEW SupplierParts (partNo) 

AS SELECT DISTINCT partNo 
FROM Supplier s, Part p 
WHERE s.partNo = p.partNo; 


讨论 如 何 将 其 维护 为 物化 视图 ， 且 在 何 种 条 件 下 不 用 访问 基 表 Part 和 Supplier 就 可 完成 视图 维护 。 
7.20 调查 你 现在 正在 使 用 的 DBMS 中 的 SQL 实现 。 讨 论 该 系统 的 DDL 语句 与 ISO 标准 是 否 兼 容 。 
调查 该 DBMS 扩展 的 任 一 功能 。 是 否 有 不 被 文 持 的 功能 ? 
7.21 创建 4.2.6 节 定 义 的 DreamHome 数据 库 模 式 ， 将 图 4.3 中 的 元 组 插入 其 中 。 
7.22 ”使 用 上 面 创建 的 模式 ， 运 行 第 6 章 诸 例子 中 给 出 的 SQL 查询 。 
7.23 ”为 第 4 章 习 题 给 出 的 Hotel 模型 创建 模式 ， 插 和 人 一些 样本 元 组 。 然 后 运行 习题 6.7 一 习题 6.28 
产生 的 SQL 查询 。 
案例 2 
习题 7.24~ 习题 7.40 使 用 第 $ 章 后 面 的 习题 定义 的 项 目 (Project) 模式 。 
7.24 使 用 SQL 的 完整 性 增强 特性 和 下 面 的 约束 条 件 创 建 Project 模式 
(a) 性 别 必须 是 单个 字母 “M" BY “F”, 
(b) 职位 必须 是 “经 理 ”、“ 团 队 负 责 人 ”、“ 分 析 师 ”和 “软件 开发 人 员 ” 之 一 。 
(c) 工时 必须 是 0 到 40 之 间 的 一 个 整数 。 
7.25 创建 一 个 视图 ， 由 Employee 和 Department 构成 ， 但 不 包括 address, DOB 和 sex 属性 。 
7.26 ”创建 一 个 由 属性 empNo、fName、IName、projName 和 hoursWorked 构成 的 视图 。 
7.27 思考 下 列 基 于 Project 模式 的 视图 : 


CREATE VIEW EmpProject(empNo, projNo, totalHours) 
AS SELECT w.empNo, w.projNo, SUM(hoursWorked) 
FROM Employee e, Project p, WorksOn w 

WHERE eempNo = w.empNo AND p.projNo = w.projNo 
GROUP BY w.empNo, w.projNo; 


对 于 下 面 每 一 个 查询 ， 陈 述 该 查询 是 否 有 效 ， 且 对 于 有 效 查询 说 明 该 查询 如 何 映射 为 对 基 表 的 查询 。 


(a) SELECT’ 
FROM EmpProject; 
(b) SELECT projNo 
FROM EmpProject 
WHERE projNo = ‘SCCS’; 
(c) SELECT COUNT (projNo) 
FROM EmpProject 
WHERE empNo = ‘E1’; 
(d) SELECT empNo, totalHours 
FROM EmpProject 
GROUP BY empNo; 
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综合 
7.28 考虑 下 表 : 


Part (partNo, contract, partCost) 


它 代 表 着 同一 零件 在 每 个 合同 下 的 协议 价格 〈 一 个 零件 在 不 同 的 合同 下 可 能 有 不 同 的 价格 )。 现 


在 考虑 下 列 视 图 ExpensiveParts， 它 包括 价格 超过 1000 英镑 的 零件 数 H: 
CREATE VIEW ExpensiveParts (partNo) 
AS SELECT DISTINCT partNo 

FROM Part 


WHERE partCost > 1000; 


讨论 如 何 将 其 维护 为 物化 视图 ， 且 在 何 种 条 件 下 不 用 访问 基 表 Part 即 可 完成 视图 的 维护 。 
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本 章 我 们 主要 学 习 : 
o 如 何 使 用 SQL 编程 语言 
© 如 何 使 用 SQL 游标 
如 何 创建 存储 过 程 
如 何 创建 触发 器 
如 何 通 过 触发 器 加 强 完整 的 约束 
触发 器 的 优 缺 点 
如 何 使 用 递归 查询 


前 两 章 集中 讨论 了 关系 DBMS 主要 的 语言 ， 也 就 是 SQL。 第 6 章 讨 论 了 SQL FPEX 
数据 操作 语言 (DML) 的 语句 : SELECT, INSERT, UPDATE 和 DELETE。 第 7 章 讨论 了 
SQL 中 主要 的 数据 定义 语言 ( DDL) 语句 ， 例 如 CREATET TABLE 和 ALTER TABLE 语句 ， 
CREATE VIEW 语句 ， 等 等 。 本 章 讨论 SQL 中 的 其 他 内 容 。 也 就 是 : 

© SQL 编程 语言 (SQL/PSM ) 

© SQL 游标 

o 存储 过 程 

o fh Ac at 

e 递归 查询 

RAMA 9 章 讨论 为 支持 面向 对 象 数 据 管理 而 在 SQL 规范 中 添加 的 特性 ; 第 30 章 
讨论 为 支持 XML(eXtensible Markup Language) 而 在 SQL 规范 中 添加 的 特性 ， 称 为 SQL/ 
XML:2011。 最 后 在 附录 工 中 讨论 如 何 将 SQL 艇 入 高 级 程序 设计 语言 。 本 章 讲述 过 程 中 主要 
是 以 图 4-3 所 示 的 DreamHome 关系 数据 库 作 为 实例 。 


8.1 SQL 编程 语言 


SQL 语言 最 初 的 两 个 版 本 中 没有 编程 结构 ， 故 不 是 计算 完备 的 。 为 克服 这 个 缺陷 ， 较 
新 的 版 本 都 支持 将 SQL AKA RR a (参见 附录 IT) 以 开发 复杂 的 数据 库 应 用 。 然 
而 ， 这 种 方式 因 混 合 两 种 编程 范 型 而 又 带 来 了 阻抗 失 配 的 问题 : 
e SQL 是 一 种 说 明 性 语言 ， 它 能 处 理 数据 行 的 集合 ， 而 C 一 类 的 高 级 语言 是 过 程 性 语 
nH, 一 次 只 能 处 理 一 个 数据 行 。 
e SQL 与 各 种 3GL 采用 不 同 的 模型 表示 数据 。 例 如 ,SQL 语言 有 预定 义 的 数据 类 型 
Date 和 Interval， 这 在 传统 的 编程 语言 中 是 没有 的 。 因 此 不 得 不 在 应 用 程序 中 进行 转 
换 ， 这 无 论 是 对 编程 还 是 运行 时 资源 使 用 来 说 都 是 一 种 低 效 。 据 估算 ， 在 编程 时 有 


172 PHY 关系 檬 型 与 语 语 


多 达 30% 的 精力 和 代码 量 用 于 此 类 转换 (Atkinson 等 ，1983 )。 进 而 ， 由 于 同时 使 
用 着 两 个 不 同 的 类 型 系统 ， 要 目 动 地 完成 应 用 程序 的 类 型 检查 也 是 不 可 能 的 。 
关于 这 个 问题 的 解决 方法 一 直 有 和 争论， 到 底 是 用 记录 级 的 面向 对 象 语言 代替 关系 语言 还 
是 将 集合 级 机 制 引 入 程序 设计 语言 呢 ? 然 而 ，SQL 现在 已 是 完全 的 编程 语言 ， 本 节 就 讨论 它 
的 一 些 编程 机 制 。 这 类 扩展 称 为 SQL/PSM ( Persistent Stored Modules， 永 久 存 储 模块 )。 为 
使 讨论 更 具体 ， 我 们 采用 主要 在 Oracle 编程 语言 PL/SQL 中 的 表示 法 。 
PL/SQL ( Programming Language/SQL ， 编 程 语 言 /SQL) 是 Oracle 对 SQL 的 过 程 化 扩 
展 。 有 两 个 版 本 的 PL/SQL， 一 个 是 Oracle 服务 需 的 一 部 分 ， 另 一 个 是 艇 入 在 某 些 Oracle T. 
具 中 的 独立 引 警 。 两 者 十 分 相似 ， 并 且 有 相同 的 编程 结构 、 语 义 和 逻 辑 机 制 ， 虽 然 Oracle 
工具 中 的 PL/SQL 为 适应 特定 工具 的 需求 多 了 一 些 扩 展 (例如 ，PL/SQL 为 Oracle Forms 所 
做 的 扩展 )。 
PL/SQL 与 现代 编程 语言 的 概念 十 分 相近 ， 





有 变量 和 篆 量 的 定义 、 控 制 结 构 、 异 党 处 理 和 (DECLARE stead 可 选 
模块 化 。PL/SQL 是 一 种 块 结构 语言 ， 每 个 块 可 “看 ienai 
DA EEI We RA ER, HI PL/SQL 程 SEON: es a AS a ae ng 
序 的 基本 单元 是 过 程 、 函 数 和 匿名 (未 命名 的 ) ) BR 
块 。 如 图 8-1 所 示 ， 一 个 PL/SQL 块 最 多 有 三 个 Bae ee “可 选 
部 分 : She 人 Re 
。 RMR ms, Hehe. | PN ee 
量 、 游 标 和 异常 的 定义 ， 也 可 以 在 这 个 图 8-1 Me OETA 
部 分 对 它们 进行 初始 化 。 


必 备 的 可 执行 语句 部 分 ， 可 以 在 这 个 部 分 对 变量 进行 操纵 。 
o 可 选 的 异常 处 理 部 分 ， 用 来 处 理 执 行 过 程 中 可 能 出 现 的 异常 。 


8.1.1 声明 
变量 和 常量 必须 在 其 他 语句 (包括 声明 语句 ) 引用 它们 之 前 进行 声明 。 声 明 的 例子 如 下 : 


vStaffNo VARCHAR2(5); 
vRent NUMBER(6, 2) NOT NULL := 600; 
MAX PROPERTIES CONSTANT NUMBER := 100; 


注意 ， 可 以 把 一 个 变量 声明 成 NOT NULL， 但 这 种 情况 下 必须 给 变量 赋 初 值 。 可 以 
使 用 “TYPE 属性 声明 某 个 变量 与 指定 表 的 某 列 或 与 某 个 其 他 变量 类 型 一 致 。 例 如 ， 声 明 
vStaffNo 变量 的 类 型 与 Staff 表 中 staffNo 列 的 类 型 一 致 ， 可 以 表示 如 下 ， 


vStaffNo Staff.staffNo20TYPE; 

vStaffNol vStaffNo%TYPE; 

同样 ， 还 可 以 使 用 %ROWTYPE 属性 声明 某 变量 的 类 型 与 一 个 表 或 视图 的 行 类 型 一 致 。 
在 这 种 情况 下 ， 记 录 中 字段 的 名 称 和 数据 类 型 将 根据 表 或 视图 中 列 的 名 称 和 数据 类 型 确定 。 
例如 ， 声 明 变 量 vStaffRec 为 Staff 表 中 的 一 行 ， 可 以 写成 


vStaffRec Staf%ROWTYPE; 
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8.1.2 ”赋值 


在 PL/SQL 块 的 可 执行 语句 部 分 ， 可 以 用 两 种 方法 给 变量 赋值 : 使 用 通常 的 赋值 语句 
(:=) 或 作为 SQL SELECT 或 FETCH 语句 的 结果 。 例 如 ， 
vStaffNo := *‘SG14’; 


vRent := 500; 
SELECT COUNT(*) INTO x FROM PropertyForRent WHERE staffNo = vStaffNo; 


在 第 三 例 中 ， 变 量 x 被 设 为 SELECT 语句 的 结果 (在 本 例 中 等 于 职员 SG14 所 管理 的 房 
产 数 量 )。 

注意 ， 在 SQL 标准 中 ， 赋 值 用 行 前 的 保留 字 SET 和 和 “=” 表示 ， 而 不 是 “: =". 例如 ， 

SET vStaffNo = ‘SG14’ 


8.1.3 ”控制 语句 


PL/SQL 支持 常见 的 分 支 、 循 环 和 顺序 控制 流 机 制 : 
条 件 IF 语句 。IF 语句 有 如 下 形式 : 


IF( 条件) THEN 
<SOL#4 
[ELSIF (4# ) THEN <SOL#4 Š>] 
[ELSE <SOL #4 #>] 
END IF; 


注意 ,在 SQL 标准 中 , H ELSEIF 而 不 是 ELSIF 。 
例如 : 


IF (position = ‘Manager’) THEN 
salary := salary*1.05; 

ELSE 
salary := salary*1.03; 

END IF; 


条 件 CASE Efo CASE 语句 允许 根据 一 组 条 件 选 择 执行 路 径 ， 形 式 如 下 : 


CASE ( #4 & ) 

[WHEN (操作 数 取 值 表 )| WHEN (查找 条 件 ) 
THEN <SQL#4# >] 

[ELSE <SQL 语句 表 >] 


END CASE; 
例如 : 
UPDATE Staff 
CASE lowercase(x) SET salary = CASE 
WHEN ‘a’ THEN x := 1; WHEN position = ‘Manager’ 
WHEN ‘b’ THEN x := 2; THEN salary * 1.05 
y := 0; ELSE 
WHEN ‘default’ THEN x := 3; THEN salary * 1.02 
END CASE; END; 


循环 语句 (LOOP). LOOP 语句 有 如 下 形式 : 
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《标号 名 : > 
LOOP 

<SQL 语句 表 > 

EXIT (标号 名 >] [WHEN (#4 #)| 
END LOOP (标号 名 >]; 


注意 , 在 SQL 标准 中 ,用 LEAVE 而 不 是 EXIT WHEN( 条 件 )。 
例如 : 


x:= l; 
myLoop: 
LOOP 

XxX :三 x+l; 

IF (x > 3) THEN 

EXIT myLoop; --- 立即 退出 循环 

END LOOP myLoop; 
--- 控制 从 这 继续 


:二 2; 
此 例 中 ， 当 x 变 得 大 于 3 时 ， 循 环 立 即 终 止 ， 控 制 从 ENDLOOP 保留 字 后 继续 。 
循环 语句 ( WHILE 和 REPEAT). WHILE 和 REPEAT 语句 形式 如 下 (注意 PL/SQL 中 
没有 语句 等 价 于 SQL 标准 的 REPEAT 语句 ): 


PL/SQL SOL 
WHILE (44) LOOP WHILE (条 件 ) DO 
<SQL 语句 表 > <SQL 语句 表 > 
END LOOP [ 标号 名 ] END WHILE [标号 名 ] 
REPEAT 
<SQL 语句 表 > 
UNTIL (条 件 ) 
END REPEAT [ #5 4 |; 
循环 语句 (FOR). FOR 语句 形式 如 下 : 
PL/SQL } SQL 
FOR 下 标 变量 >( 条 件 ) FOR 《< 下 标 变量 > 
IN 下限- 上 限 LOOP AS 《查询 说 明 > DO 
<SQL 语句 表 > <SQL 语句 表 > 
END LOOP [ #4 4 |; END FOR | #4 4}; 
下 面 是 PL/SQL 中 FOR 循环 的 例子 : 
DECLARE 
numberOfStaff NUMBER; 


SELECT COUNT (*) INTO numberOfStaff FROM PropertyForRent 
WHERE staffNo = ‘SG14’;myLoop1: 
FOR iStaff IN 1 .. numberOfStaff LOOP 


下 面 是 SQL 标准 FOR 循环 的 例子 : 


myLoop!l: 
FOR iStaff AS SELECT COUNT(*) FROM PropertyForRent 
WHERE staffNo = ‘SG14’ DO 
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END FOR myLoop!l; 
随后 还 会 给 出 这 些 结构 的 为 外 一 些 示例 。 


8.1.4 PL/SQL 的 异常 - 


异常 是 PL/SQL 中 的 一 种 标识 符 ， 帮 在 执行 块 时 引发 ， 将 终止 程序 主体 部 分 的 执行 。 当 
一 个 异常 引发 时 ， 尽 管 异 常 处 理 过 程 会 执行 一 些 善 后 操作 ， 但 块 本 身 总 会 终止 执行 。 异 常 可 
能 由 Oracle 自动 引发 ， 例 如 ， 无 论 何 时 若 SELECT 语句 从 数据 库 中 无 法 检索 到 行 ， 则 会 引 . 
发 一 个 NO_DATA FOUND 异常 。 男 外 ， 也 可 以 使 用 RAISE 语句 显 式 地 引发 一 个 异常 。 必 
须 指定 一 个 特殊 程序 ( 称 为 异常 处 理 过 程 ) 来 处 理 引 发 的 异常 。 

正如 前 述 内 容 ， 用 户 自 定义 异常 需要 在 PL/SQL 块 的 声明 部 分 进行 定义 。 在 执行 部 分 应 
该 包含 对 异常 引发 条 件 进行 检查 的 代码 ， 一 旦 发 现 此 条 件 为 真 则 会 引发 一 个 异常 。 异 常 处 
Shit FAR EE PL/SQL 块 的 结尾 部 分 定义 的 。 图 8-2 给 出 了 一 个 异常 处 理 过 程 的 例子 。 这 
个 例子 也 说 明了 如 何 使 用 Oracle 提供 的 DBMS OUTPUT 包 ， 这 个 包 人 允许 从 PL/SQL 块 和 子 
程序 进行 输出 。put_line 过 程 能 够 向 SGA 的 缓冲 区 中 输出 信息 ， 通 过 调用 get_line 过 程 或 在 
SQL*Plus 中 设置 SERVEROUTPUT ON 属性 ， 即 可 显示 这 些 信息 。 


DECLARE 
vpCount NUMBER; 
vStaffNo PropertyForRent.staffNo%TYPE := ‘SG14’; 
-定义 一 个 异常 用 于 处 理 “ 任 一 员工 不 得 管理 多 于 100 处 房产 ”这 一 条 业务 约束 
e_too_many_properties EXCEPTION; 
PRAGMA EXCEPTION_INIT(e_too_many_properties, -20000); 
BEGIN 
SELECT COUNT(*) INTO vpCount 
FROM PropertyForRent 
WHERE staffNo = vStaffNo; 
IF vpCount = 100 
一 引发 对 应 这 一 条 约束 的 异常 
RAISE e_too_many_properties; 
END IF; 
UPDATE PropertyForRent SET staffNo = vStaffNo WHERE propertyNo = ‘PG4’; 
EXCEPTION 
-处 理 对 应 这 一 条 约束 的 异常 
WHEN e_too_many_properties THEN 


dbms_output.put_line( Member of staff * || staffNo || ‘already managing 100 properties’); 


END; 





图 8-2 PL/SQL 中 异常 处 理 过 程 的 实例 


条 件 处 理 

为 处 理 异常 和 完成 条 件 ，SQL 永久 存储 模块 (SQL/PSM) 语言 中 提供 条 件 处 理 机 制 。 该 
机 制 要 求 首先 定义 处 理 器 ( handler)， 即 指明 其 类 型 、 针 对 的 异常 和 完成 条 件 以 及 处 理 器 采 
取 的 动作 (一 个 SQL 过 程 语句 )。 条 件 处 理 机 制 还 能 通过 SIGNAL/RESIGNAL 语句 显示 地 
引发 异常 和 完成 条 件 。 

与 某 个 异常 和 完成 条 件 相 关联 的 处 理 器 可 用 DECLARE: HANDLER 语句 说 明 为 : 
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DECLARE {CONTINUE | EXIT | UNDO} HANDLER 
FOR SQLSTATE ({sqlstateValue | conditionName | SQLEXCEPTION | 
SQLWARNING | NOT FOUND} handlerAction; 


一 个 条 件 名 及 可 选 的 对 应 SQLSTATE 值 可 定义 如 下 : 


DECLARE conditionName CONDITION 
[FOR SQLSTATE salstateValue] 


一 个 异常 条 件 可 如 下 引发 或 再 引发 : 
SIGNAL sqlstateValue; % RESIGNAL sqlstateValue; 


当 执 行 包含 处 理 器 定义 的 复合 语句 时 ， 该 处 理 器 即 为 相关 联 的 条 件 而 创建 。 但 该 处 
理 器 只 有 是 与 SQL 语句 引发 的 条 件 最 合适 的 处 理 器 时 才 被 激活 。 知 处 理 器 类 型 说 明 为 
CONTINUE， 则 激活 后 首先 执行 处 理 器 动作 ， 然 后 将 控制 返回 复合 语句 。 若 处 理 器 说 明 为 
EXIT 型 ， 则 执行 完 处 理 器 动作， 处 理 器 离开 复合 语句 。 知 处 理 需 说 明 为 UNDO 型 ， 则 首先 
回 滚 在 复合 语句 中 已 做 所 有 修改 ， 然 后 执行 处 理 需 动作 ， 最 后 将 控制 返回 复合 语句 。 如 果 处 
理 需 未 能 以 成 功 完 成 条 件 完 成 ， 则 隐 含 执行 一 条 RESIGNAL 语句 ， 试 图 寻找 另 一 个 处 理 咒 
来 处 理 这 个 条 件 。 


8.1.5 PL/SQL 的 游标 


如 果 查 询 返 回 一 行 且 仅 一 行 ， 则 直接 用 SELECT 语句 即 可 。 为 了 处 理 那 些 返回 任意 数 
量 〈 零 个 、 一 个 或 多 个 ) 行 的 查询 ，PL/SQL 引入 了 游标 (cursor) 的 概念 ， 以 便 能 够 每 次 只 
访问 查询 结果 中 的 一 行 。 实 际 上 ， 游 标 就 像 是 一 个 指向 查询 结果 中 特定 行 的 指针 。 游 标 可 以 
前 进 一 格 ,以便 访问 下 一 行 。 游 标 在 使 用 之 前 必须 声明 并 打开 。 如 果 不 再 需要 使 用 它 ， 则 必 
须 将 它 关 闭 。 一 旦 打开 游标 ， 就 可 以 使 用 FETCH 语句 ， 每 次 只 访问 查询 结果 中 的 一 行 ， 这 
与 SELECT 语句 正好 相反 (在 附录 了 中 可 以 看 到 ，SQL 骨 人 高 级 语言 中 ， 也 是 使 用 游标 来 处 
理 那 些 返 回 任意 数目 行 的 查询 )。 


| il 8.1 >> 游标 的 使 用 
图 8-3 说 明了 如 何 使 用 游标 来 确定 职员 SG14 所 管理 的 房产 。 因 为 查询 可 以 返回 任意 数 
量 的 行 ， 所 以 必须 使 用 游标 。 

此 例 中 需要 重点 注意 的 地 方 : 

e 在 DECLARE 部 分 ,定义 了 一 个 名 为 propertyCursor 的 游标 。 

e 在 语句 部 分 首先 要 打开 游标 ， 其 语句 执行 效果 包括 分 析 在 游标 声明 中 指出 的 
SELECT 语句 ， 找 出 满足 搜索 条 件 的 行 〈 称 为 活动 集 )， 并 把 指针 定位 在 活动 集中 的 
第 一 行 之 前 。 注 意 ， 如 果 查 询 没有 返回 任何 行 ， 则 打开 游标 PL/SQL 不 会 引发 异常 。 

e 接 下 来 的 代码 会 循环 遍历 活动 集中 的 每 一 行 ， 并 且 使 用 FETCH INTO 把 当前 行 的 值 
提取 到 输出 变量 中 。 每 条 FETCH 语句 还 会 把 指针 移 向 活动 集中 的 下 一 行 。 

e 代码 将 检测 游标 是 否 未 指向 一 行 (propertyCursor%NOTFOUND)， 如 果 没 有 找到 行 
则 退出 循环 (EXIT WHEN), WW DBMS OUTPUT 包 显 示 房 产 的 详细 资料 ， 并 进 
入 下 一 轮 循 环 。 

o 提取 结束 后 将 游标 关闭 。 

e 最 后 ,异常 块 将 显示 所 有 可 能 过 到 的 出 错 情况 。 
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DECLARE 
vPropertyNo PropertyForRent.propertyNo%TYPE; 
vStreet PropertyForRent.street%TYPE; 
vCity PropertyForRent.city%TY PE; 
vPostcode PropertyForRent.postcode%TY PE; 
CURSOR propertyCursor IS 
SELECT propertyNo, street, city, postcode 
FROM PropertyForRent 
WHERE staffNo = ‘SG14 
ORDER by propertyNo; 
BEGIN 
-- 打 开 游 标 开始 选择 ， 然 后 循环 提取 结果 表 中 的 每 一 行 
OPEN propertyCursor; 
LOOP 


-提取 结果 表 中 的 下 一 行 
FETCH propertyCursor 


INTO vPropertyNo, vStreet, vCity, vPostcode; 
EXIT WHEN propertyCursor%¥NOTFOUND; 


一 显示 数据 
dbms_output.put_line(‘Property number: || vPropertyNo); 


dbms_output.put_line(‘Street: "|| vStreet); 


dbms_output.put_line(‘City: ” || vCity); 
IF postcode IS NOT NULL THEN 
dbms_output.put_line(“Post Code: > || vPostcode); 
ELSE 
dbms_output.put_line(“Post Code: NULL’); 
END IF; 
END LOOP; 
IF propertyCursor%ISOPEN THEN CLOSE propertyCursor END IF; 


-错误 条 件 一 打印 出 错误 
EXCEPTION 
WHEN OTHERS THEN 
dbms_output.put_line(‘Error detected’); 
IF propertyCursor%ISOPEN THEN CLOSE propertyCursor; END IF; 





图 8-3 7E PL/SQL 中 使 用 游标 来 处 理 多 行 查询 
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如 果 最 近 的 一 次 提取 没有 返回 行 ， 则 %NOTFOUND 的 值 为 真 。 除 了 “NOTFOUND, 


游标 还 有 如 下 一 些 有 用 的 属性 : 


e %FOUND: 如 果 最 近 的 提取 返回 了 一 行 ， 则 它 的 值 为 真 (与 %NOTFOUND 互补 )。 


e %ISOPEN: 如 果 游 标 处 于 打开 状态 ， 则 它 的 值 为 真 。 
èe %ROWCOUNT: 计算 迄今 为 止 返回 的 总 行 数 。 


4 


向 游标 传递 参数 。PL/SQL 可 以 将 游标 参数 化 ， 因 此 同一 个 游标 定义 可 以 在 不 同 的 条 件 


下 重复 使 用 。 例 如 ， 可 以 将 前 面 例子 中 的 游标 定义 改写 成 


CURSOR propertyCursor (vStaffNo VARCHAR2) IS 
SELECT propertyNo, street, city, postcode 
FROM PropertyForRent 
WHERE staffNo = vStaffNo 
ORDER BY propertyNo; 
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还 可 以 用 下 面 的 语句 打开 游标 : 


vStaffNol PropertyForRent.staffNo%TYPE := ‘SG14’; 
OPEN propertyCursor(‘SG14’); 
OPEN propertyCursor( SA9 ); 
OPEN propertyCursor(vStaffNo 1); 
通过 游标 更 新 行 。 通 过 游标 获取 行 后 ， 可 以 更 新 或 删除 行 。 在 这 个 例子 中 ， 为 了 确保 行 
在 游标 声明 与 打开 后 直到 从 活动 集 提 取 之 前 不 被 修改 ， 在 游标 声明 中 添加 了 FOR UPDATE 
子 句 。 可 以 通过 这 个 子 句 给 行 的 活动 集 加 锁 ， 以 防止 游标 处 于 打开 状态 时 所 发 生 的 更 新 冲突 
(第 22 章 将 讨论 加 锁 和 更 新 冲突 )。 
举例 说 明 ， 如 果 想 将 职员 SG14 管理 的 房产 重新 分 配给 职员 SG37， 则 游标 的 声明 如 下 : 
CURSOR propertyCursor IS 
SELECT propertyNo, street, city, postcode 
FROM PropertyForRent 
WHERE staffNo = ‘SG14’ 


ORDER BY propertyNo 
FOR UPDATE NOWAIT; 


默认 情况 下 ，Oracle 服务 器 如 果 不 能 获取 SELECT FOR UPDATE 游标 所 返回 的 活动 集 
行 上 的 锁 ， 它 就 会 一 直 等 待 。 为 了 防止 这 种 情况 发 生 ， 可 以 选择 使 用 NOWAIT KES, € 
会 测试 一 次 加 锁 操作 是 否 成 功 。 在 活动 集 循环 时 ， 可 以 给 SQL 的 UPDATE 或 DELETE 语句 
添加 一 个 WHERE CURRENT OF 子 句 ， 用 来 说 明 更 新 作用 于 活动 集 的 当前 行 上 。 例 如 ， 
UPDATE PropertyForRent 


SET staffNo = ‘SG37’ 
WHERE CURRENT OF propertyCursor; 


COMMIT; 


SQL 标准 中 的 游标 。SQL 标准 中 的 游标 与 前 面 讨论 的 稍 有 不 同 ， 感 兴趣 的 读者 参见 附 
XK l 


8.2 FERF., TRII, SAMA 


子 程 序 指 的 是 带 有 参数 并 能 被 调用 的 命名 PL/SQL H, PL/SQL 有 两 种 类 型 的 子 程序 : ( 存 
储 ) 过 程 和 函数 。 过 程 和 函数 都 能 带 有 一 组 由 调用 程序 传递 给 它们 的 参数 ， 并 且 能 够 执行 一 
系列 动作 。 它 们 都 能 修改 和 返回 作为 参数 传递 给 它们 的 数据 。 两 者 之 间 的 不 同 在 于 : 函数 总 
是 向 调用 者 返回 一 个 单独 的 值 ， 而 过 程 则 没有 这 个 限制 。 通 常 ， 如 果 不 是 仅 需 返回 一 个 值 ， 
一 般 会 选择 使 用 过 程 。 

与 绝 大 多 数 高 级 语言 中 的 过 程 和 图 数 很 相似 ， 它 们 也 有 同样 的 优点 : 提供 了 模块 性 和 可 
扩展 性 ， 提 高 了 可 重用 性 和 易 维 护 性 ， 另 外 还 提供 了 抽象 性 。 参 数 除了 拥有 名 称 和 数据 类 型 
之 外 ， 还 可 以 标明 为 : 

e IN: 该 类 参数 只 能 作为 输入 值 。 

© OUT: 该 类 参数 只 能 作为 输出 值 。 

e IN OUT: 该 类 参数 既 可 以 作为 输入 值 ， 也 可 以 作为 输出 值 。 

例如 ， 可 以 在 图 8-3 的 匿名 PL/SQL 块 的 开头 添加 如 下 几 行 ， 使 它 变 成 一 个 过 程 : 
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CREATE OR REPLACE PROCEDURE PropertiesForStaff 
(IN vStaffNo VARCHAR2) 
该 过 程 可 以 在 SQL*Plus 中 执行 ， 如 下 所 示 : 


SQL> SET SERVEROUTPUT ON; 
SQL> EXECUTE PropertiesForStaff(‘SG14’); 


第 9 章 将 更 详细 地 讨论 函数 和 过 程 。 
包 (PL/SQL) 

把 过 程 、 函 数 、 变 量 和 SQL 语句 组 合 起 来 ， 并 存储 为 一 个 单独 的 程序 单元 ， 就 形成 了 
包 。 包 由 两 部 分 组 成 : 说 明 部 分 和 体 部 分 。 说 明 部 分 声明 了 包 的 全 部 公有 结构 ， 体 部 分 则 定 
义 了 包 的 所 有 结构 (公有 的 和 私有 的 )， 即 实现 了 声明 部 分 。 通 过 这 种 方式 ， 包 实现 了 一 种 
封装 形式 。 在 Oracle 中 ， 创 建 一 个 过 程 或 包 时 执行 如 下 步骤 : 

o 编译 过 程 或 包 。 

© 将 编译 后 的 代码 存储 在 内 存 中 。 

o 将 过 程 或 包 存 人 数据 库 。 

对 于 前 面 提 到 的 例子 ， 可 以 创建 一 个 如 下 所 示 的 包 说 明 部 分 

CREATE OR REPLACE PACKAGE StaffPropertiesPackage AS 


procedure PropertiesForStaff(vStaffNo VARCHAR2); 
END StaffPropertiesPackage; 


对 应 的 包 体 部 分 〈 包 的 实现 ) 可 以 是 


CREATE OR REPLACE PACKAGE BODY StaffPropertiesPackage 
AS 


END StaffPropertiesPackage; 


”可 以 使 用 点 标记 法 来 引用 包 说 明 部 分 中 所 声明 的 项 。 例 如 ， 可 以 按照 如 下 所 示 的 方法 调 
用 PropertiesForStaff 过 程 : 


StaffPropertiesPackage.PropertiesForStaff(‘SG14’); 


8.3 ihc ae 


触发 器 定义 了 当 应 用 程序 中 发 生 某 种 事件 时 ， 数 据 库 应 该 执行 哪些 动作 。 触 发 硕 也 可 以 
用 来 增强 引用 完整 性 约束 和 复杂 约束 或 者 是 审计 对 数据 进行 的 修改 。 
SQL 中 触发 大 的 一 般 形 式 为 ; 


CREATE TRIGGER 触发 器 名 
BEFORE | AFTER | INSTEAD OF 
INSERT | DELETE | UPDATE [OF 触发 列表 ] 


ON #4 

[REFERENCING {OLD | NEW} AS { 老 元 组 名 | 新 元 组 名 } 
[FOR EACH {ROW | STATEMENTJ] 

[WHEN 条 件 ] 

< 触发 动作 > 
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这 还 不 是 完全 的 定义 ， 但 足以 说 明 概 念 了 。 和 触发 需 中 的 代码 称 为 触发 器 体 或 触发 动作 ， 
由 PL/SQL 块 构成 。 触 发 器 是 基于 事件 -= 条件- 动作 ( Event-Condition-Action, ECA) $ 
型 的 。 
o 事件 (event 或 events) 触发 规则 。 事 件 可 以 是 对 指定 表 (或 视图 ) 进行 操作 的 
INSERT, UPDATE 或 DELETE 语句 。 在 Oracle 中 ， 事 件 还 可 以 是 : 
m 作用 于 任何 模式 对 象 的 CREATE, ALTER 或 DROP 语句 。 
e 数据 库 启动 或 关闭 ， 用 户 登 录 或 注销 。 
m 指定 的 错误 消息 或 任何 错误 消息 。 
此 外 ， 还 可 以 指定 触发 器 是 在 事件 发 生 之 前 工作 ， 还 是 在 事件 发 生 之 后 工作 。 
e 条 件 (condition) 决定 动作 是 否 需 要 被 执行 。 对 于 触发 需 来 说 ， 条 件 并 不 是 必需 的 。 
但 是 ， 如 果 指 定 了 条 件 ， 那 么 只 有 当 条 件 为 真 时 才 会 执行 动作 。 
e 动作 (action) 就 是 要 执行 的 操作 。 一 旦 触发 语句 事件 并 且 触 发 器 条 件 被 判定 为 真 ， 
那么 就 会 执行 动作 中 包含 的 PL/SQL 语句 和 代码 。 
触发 器 可 以 分 为 两 种 : 行 级 触发 器 (FOR EACH ROW) 和 语句 级 触发 占 (FOR EACH 
STATEMENT ) 。 前 者 在 触发 器 事件 影响 表 中 每 一 行 时 都 会 执行 ， 而 后 者 在 触发 需 事件 影响 
表 中 的 多 个 行 时 只 会 执行 一 次 。SQL 也 支持 INSTEAD OF 触发 器 ， 这 种 触发 器 提供 了 一 种 
透明 的 方法 ， 来 修改 那些 不 能 通过 SQL DML 语句 (INSERT, UPDATE 和 DELETE) 直接 
修改 的 视图 。 这 种 触发 器 之 所 以 称 为 INSTEADOF 触发 器 ， 是 因为 触发 它们 的 目的 是 替代 原 
本 的 SQL 语句 ， 这 与 其 他 触发 器 不 同 。 触 发 器 还 可 以 一 个 接 一 个 地 连续 和 触发。 一 个 触发 硕 
动作 修改 了 数据 库 ， 就 可 能 导致 另 一 个 触发 器 事件 的 发 生 。 


| 例 8.2 >» AFTER 行 级 触发 器 
创建 一 个 AFTER 行 级 触发 器 ， 用 以 保留 插入 sta 任 表 的 所 有 行 审 计 踩 迹 。 
CREATE TRIGGER StaffAfterlnsert 
AFTER INSERT ON Staff 
REFERENCING NEW AS new 
FOR EACH ROW 
BEGIN 
INSERT INTO StaffAudit 
VALUES (:new.staffNo, :new.fName, :new.IName, :new.position, 


:new.sex, :new.DOB, :new.salary, :new.branchNo); 
END; 


注意 ,在 SQL 标准 中 ,用 NEW ROW 而 不 是 NEW,， 用 OLD ROW 而 不 是 OLD。 & 


| 例 8.3 >) 使 用 BEFORE 触发 器 
DreamHome 有 一 条 规则 ， 禁 止 一 名 职员 同时 管理 100 处 以 上 的 房产 。 为 此 ， 可 以 创建 
一 个 图 8-4 所 示 的 触发 器 来 确保 这 一 业务 约束 。 在 向 表 PropertyForRent 中 插入 一 行 之 前 ， 
或 者 更 新 现 有 的 一 行 之 前 ， 就 会 调用 该 触发 器 。 如 果 该 职员 当前 管理 着 100 Whar, ASC 
会 显示 一 条 信息 并 放弃 这 一 事务 。 下 面 几 点 应 该 注意 : 
o 关键 字 BEFORE 指出 ， 应 该 在 插入 或 更 新 操作 应 用 于 表 PropertyForRent 之 前 执行 
e 关键 字 FOR EACH ROW 指出 这 是 一 个 行 触发 器 ， 即 当 语句 更 新 表 PropertyForRent 
的 每 一 行 时 ， 该 触发 硕 都 会 执行 一 次 。 K4 
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CREATE TRIGGER StaffNotHandlingTooMuch 

BEFORE INSERT ON PropertyForRent 

REFERENCING NEW AS newrow 

FOR EACH ROW 

DECLARE 

vpCount NUMBER; 

BEGIN 
SELECT COUNT(*) INTO vpCount 
FROM PropertyForRent 
WHERE staffNo = :newrow.staffNo; 
IF vpCount = 100 


raise_application_error(-20000, (‘Member || :newrow.staffNo || ‘already managing 100 properties’); 
END IF; 





图 8-4 茶 止 一 名 职员 同时 管理 100 处 以 上 房产 的 触发 各 


| 例 8.4 入 使 用 触发 器 增强 引用 完整 性 

默认 情况 下 ，Oracle 对 指定 的 外 部 关键 字 施 加 引用 动作 ON DELETE NO ACTION 
和 ON UPDATE NO ACTION (参见 7.2.4 节 )。 它 也 允许 通过 附加 子 句 ON DELETE 
CASCADE， 指 明 父 表 元 组 删除 时 级 联 到 子 表 元 组 。 然 而 ，Oracle 不 支持 ON UPDATE 
CASCADE, ON UPDATE SET DEFAULT 和 ON UPDATE SET NULL。 如 果 需 要 执行 这 
些 动作 ， 就 必须 通过 和 触发 希 、 存 储 过 程 或 者 应 用 程序 编程 来 实现 。 例 如 ， 在 例 7.1 P, K 
PropertyForRent 中 的 外 部 关键 字 staffNo 应 该 有 ON UPDATE CASCADE 动作 。 该 操作 可 以 
使 用 图 8-5 Jot Aas AY fh AZ ASE 
触发 器 1 (PropertyForRent Check Before) 

无 论 何 时 更 新 PropertyForRent 表 中 的 staffNo 列 ， 都 会 激活 图 8-5a 所 示 的 触发 器 。 在 
更 新 操作 发 生 之 前 ， 和 触发 需 会 检查 更 新 的 新 值 是 否 存 在 于 表 Staff 中 。 如 果 引 发 了 一 个 
Invalid_Staff 异常 ， 触 发 右 就 会 发 出 一 个 错误 信息 ， 并 且 阻 止 更 新 的 发 生 。 
对 应 Staff 表 修 改 的 触发 器 

无 论 何 时 更 新 表 Staff 中 的 staffNo 列 ， 都 会 激活 图 8-5b Mra =P fh Aa. TERE M 
触发 希 之 前 ， 已 经 随同 公共 变量 updateSeq (这 三 个 触发 器 可 以 通过 seqPackage 包 访 问 
该 变量 ) 一 起 创建 了 一 个 序列 号 updateSequence, Yb, XÆ PropertyForRent 还 增加 了 
一 列 ， 该 列 名 为 updateId， 用 来 标记 某 一 行 是 否 被 更 新 过 ， 以 防止 它 在 逐 层 操作 中 被 重 
复 更 新 。 
触发 器 2 (Cascade StaffNo Updatel ) 

这 个 (语句 级 ) 触发 器 在 更 新 表 Staff 的 staffNo 列 之 前 被 激活 ， 并 且 为 更 新 操作 设置 一 
个 新 的 序列 号 。 
触发 器 3 (Cascade StaffNo Update2 ) 

这 个 〈 行 级 ) 触发 大 在 把 表 PropertyForRent 中 所 有 行 的 旧 staffNo {Al ( :old.staffNo) 更 
新 成 新 值 (:new.staffNo) 时 被 激活 ， 并 且 把 行 标记 成 已 更 新 过 。 
触发 器 4 (Cascade StaffNo Update3 ) 

最 后 一 个 (语句 级 ) 触发 需 在 更 新 操作 之 后 被 激活 ， 并 且 把 标记 过 的 行 重新 标记 成 没有 
更 新 过 。 
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删除 触发 器 
触发 器 能 用 语句 DROP TRIGGER < 触发 器 名 > 删除 。 
TRIGGER 权限 


一 个 用 户 想 在 表 上 创建 触发 器 ， 除 非 他 是 该 表 的 所 有 者 (此 时 这 个 用 户 继承 了 
TRIGGER 权限 ) 或 者 他 获得 了 该 表 的 TRIGGER 授权 (参见 7.6 节 )。 
触发 器 的 优 缺 点 


数据 库 触发 器 有 在 干 优 缺 点。 优点 包括 : 


-- 更 新 PropertyForRent 表 中 的 staffNo 列 之 前 激活 该 触发 器 

-- 检 查 新 的 外 部 关键 字 值 是 否 存 在 于 表 Staff 中 

CREATE TRIGGER PropertyForRent_Check_Before 一 一 一 一 一 操作 前 触发 器 
BEFORE UPDATE OF staffNo ON PropertyForRent 


FOR EACH ROW WHEN (new.staffNo IS NOT NULL) 
DECLARE 


dummy CHAR(5); 
invalid_staff EXCEPTION; 
valid_staff EXCEPTION; 
mutating table EXCEPTION; 
PRAGMA EXCEPTION_INIT (mutating_table, -4091); 
-- 用 游标 检查 父 关键 字 的 值 是 否 存在 
-- 用 FOR UODATE OF 锁 住 父 关 键 字 那 行 直 至 本 事务 结束 ， 使 其 不 会 被 另 一 事务 删除 
-- by another transaction until this transaction completes. 
CURSOR update_cursor (sn CHAR(5)) IS 
SELECT staffNo FROM Staff 
WHERE staffNo = sn 
FOR UPDATE OF staffNo; 
BEGIN 


OPEN update_cursor (:new.staffNo); 


触发 器 激活 条 件 


行 级 触发 器 


FETCH update_cursor INTO dummy; 
一 检查 父 关键 字 ， 必 要 时 引发 异常 、 
IF update_cursor%NOTFOUND THEN 


RAISE invalid_staff; 
ELSE 
RAISE valid_staff; 
END IF; 
CLOSE update_cursor; 
EXCEPTION 
WHEN invalid_staff THEN 
CLOSE update_cursor; 
raise_application_error(-20000, ‘Invalid Staff Number’ || :new.staffNo); 
WHEN valid_staff THEN 
CLOSE update_cursor; 
-变异 表 ( mutating-table ) 是 因 INSERT、UPDATE 和 DELETE 语 名 而 正在 修改 的 表 ， 也 可 能 
一 是 由 于 引用 完整 性 约束 UPDATE CASCADE 而 需要 修改 的 表 
一 这 个 错误 引发 一 个 异常 ， 但 此 时 该 异常 OK， 只 提 捕 它 ， 不 做 任何 事 
WHEN mutating_table THEN 
NULL; 





END; 


a) 表 PropertyForRent 的 触发 器 


图 8-5 Oracle LER, HK Staff 的 主 关键 字 staffNo 被 更 新 时 ， 能 人 够 确保 对 表 
PropertyForRent 的 外 部 关键 字 staffNo 的 ON UPDATE CASCADE 操作 
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-创建 序列 号 和 公共 变量 UPDATESEQ 

CREATE SEQUENCE updatesequence INCREMENT BY 1 MAXVALUE 500 CYCLE; 

CREATE PACKAGE seqpackage AS 
updateseq NUMBER; 

END seqpackage; 

CREATE or REPLACE PACKAGE BODY seqpackage AS END seqpackage; 


人 和 序列 号 的 包 


-- 在 表 PropertyForRent 中 增加 一 列 ， 标 记 更 新 过 的 行 在 表 PropertyForRent 


E 一 一 一 
ALTER TABLE PropertyForRent ADD updateid NUMBER; 中 增加 一 列 


-- 在 更 新 表 Staff 之 前 激活 这 个 语句 级 触发 器 ， 产 生 一 个 新 的 序列 号 并 赋 给 公共 变量 UPDATESEQ 


CREATE TRIGGER Cascade_StaffNo_Updatel 
BEFORE UPDATE OF staffNo ON Staff DE nana ae atte 
DECLARE 
dummy NUMBER; 
BEGIN 
SELECT updatesequence. NEXTVAL 
INTO dummy FROM dual; | 4 一 一 一 一 一 一 一 一 一 一 为 更 新 置 新 的 序列 号 
seqpackage.updateseq := dummy; 


语句 级 操作 前 触发 
a (Ri) 


END; 


-- 创 建 一 个 行 级 触发 器 ， 级 联 修改 表 PropertyForRent 
-- 仅 级 联 修改 那些 还 没 被 该 触发 器 修改 过 的 子 行 
CREATE TRIGGER Cascade_StaffNo_Update2 


AFTER UPDATE OF staffNo ON Staff = 
FOR EACH ROW Je aanren 


BEGIN 
UPDATE PropertyForRent SET staffNo = :new.staffNo, 


updateid = seqpackage.updateseq 
WHERE staffNo = :old.staffNo AND updateid IS NULL; ee, 
END; 更 新 PropertyRent 表 并 为 


-创建 最 后 一 个 语句 级 操作 后 触发 器 ， 负 责 重 置 更 新 标记 NA ody 
CREATE TRIGGER Cascade_StaffNo_Update3 


AFTER UPDATE OF staffNo ON Staff ’ 
BEGIN 语句 级 操作 后 触发 器 ， 
. x x Sa = 志 
UPDATE PropertyForRent SET updateid = ae. 为 更 新 过 的 行 重 置 标志 


WHERE updateid = seqpackage.updateseq; 
END; 


b) 表 Staff 的 触发 器 
图 8-5 ( 续 ) 


o 删除 了 多 余 代 码 。 使 用 触发 硕 只 需 在 数据 库 端 存 一 份 代码 ， 从 而 避免 了 所 有 用 到 其 
所 描述 功能 的 客户 应 用 各 目 写 一 通 代码 。 

© 简化 修改 。 触 发 需 一 经 修改 ， 其 他 所 有 应 用 即 能 目 动 享用 这 个 修改 。 因 此 修改 只 
需 一 次 编码 、 一 次 测试 ， 所 有 访问 数据 库 的 应 用 就 集中 得 到 了 提升 。 此 外 ， 和 触发 需 
通常 都 由 有 经 验 的 DBA 控制 着 ， 至 少 由 他 们 负责 审核 ， 故 触发 需 的 实现 会 更 高 效 
一 些 。 

o 增强 了 安全 性 。 触 发 硕 都 存储 在 数据 库 里 ， 自 然 享 有 DBMS 提供 的 安全 保护 。 

© 改良 了 完整 性 。 正 如 前 面 所 述 ， 触 发 套 能 用 于 实现 某 些 类 型 的 完整 约束 条 件 。 因 此 ， 
将 触发 器 存储 在 数据 库 中 能 使 DBMS 路 所 有 应 用 一 致 地 实施 完整 约束 。 
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© 改良 了 处 理 能 力 。 触 发 器 一 体 地 为 DBMS 和 数据 库 增 强 处 理 能 力 。 

o 与 客户 /服务 器 结构 相配 。 触 发 器 集中 激活 和 处 理 的 特性 非常 适合 客户 / 服务 器 结构 
(参见 第 3 章 )。 客 户 端 一 旦 发 出 请 求 ， 服 务 器 端 自动 完成 检查 和 执行 操作 整个 动作 
序列 。 由 于 数据 和 操作 都 无 需 在 客户 和 服务 器 两 端 传送 ， 所 以 性 能 也 得 到 提高 。 

触发 器 的 缺点 包括 : 

o 性 能 耗费 。 和 触发 器 的 管理 和 执行 都 有 性 能 耗费 ， 这 不 得 不 与 前 述 的 好 处 权衡 考虑 。 
© 级 联 效果 。 一 个 触发 器 的 动作 可 能 又 引发 另 一 个 触发 器 ， 接 连 下 去 可 能 一 连 串 。 这 
不 仅 可 能 对 数据 库 造 成 大 的 改变 ， 也 可 能 造成 设计 触发 器 之 初 难以 预料 的 效果 。 

o 无 法 调度 。 和 触发 器 不 能 调度 ， 只 有 引发 它 的 事件 出 现时 才 执 行 。 

e 可 移植 性 差 。 尽 管 SQL 标准 已 包括 触发 器 ， 但 大 多 数 DBMS 还 是 实现 的 触发 器 方 


言 ， 从 而 影响 了 可 移植 性 。 < 


8.4 ”递归 


关系 模型 要 求 数据 为 原子 的 ， 故 不 能 出 现 重复 组 。 因 此 极 难 处 理 递 归 查 询 ， 也 就 是 关系 
跟 它 自己 的 (直接 或 间接 ) 关系 的 查询 。 为 了 说 明 这 个 新 操作 ， 我 们 以 下 一 章 图 9-1 中 简化 
的 sta 任 关系 为 例 ， 该 关系 中 仅 存 储 了 员工 编号 及 其 经 理 的 员工 编号 。 为 了 找 出 所 有 员工 的 
所 有 经 理 ， 需 用 到 下 面 这 个 SQL:2008 提供 的 递归 查询 : 
WITH RECURSIVE 
AliManagers (staffNo, managerStaffNo) AS 
(SELECT staffNo, managerStaffNo 
FROM Staff 
UNION 
SELECT in.staffNo, out.managerStaffNo 
FROM AllManagers in, Staff out 
WHERE in.managerStaffNo = out.staffNo); 
SELECT * FROM AlliManagers 
ORDER BY staffNo, managerStaffNo; 


该 查询 创建 的 结果 表 allManagers 中 有 两 列 staffNo 和 managerStaffNo， 包 含 了 所 有 员 
工 的 所 有 经 理 。UNION 操作 执行 的 是 将 内 部 查询 块 产生 的 所 有 行 并 入 直至 无 新 行 产 生 。 注 
意 ， 若 指明 UNION ALL， 则 所 有 重复 值 都 将 保留 在 结果 表 中 。 

某 些 情形 下 ， 应 用 可 能 要 求 数据 以 某 种 顺序 插入 结果 表 中 ， 递归 语句 允许 说 明 两 种 
顺序 : 

e 深度 优先 ， 即 在 结果 关系 中 每 个 父 项 或 包含 项 出 现在 所 包含 的 哪些 项 之 前 ， 这 些 项 

又 出 现在 其 父 项 的 兄弟 项 (拥有 同一 个 父 项 或 包含 项 ) 之 前 。 

e 宽度 优先 ,项 紧 跟 其 兄弟 项 而 不 是 兄弟 的 孩子 。 

例如 ， 在 上 面 WITH RECURSIVE 后 加 子 句 : 

SEARCH BREADTH FIRST BY staffNo, managerStaffNo 

SET orderColumn 

SET 于 人 句 设置 一 个 名 叫 orderColumn 的 新 列 ，SQL 用 其 排序 宽度 优先 产生 的 结果 。 

如 果 数 据 本 里 而 不 仅 是 数据 的 结构 有 递归 ， 将 导致 无 限 循环 ， 除 非 能 删除 循环 。 递 归 语 
句 可 用 CYCLE FAJ, XIE SQL 会 用 一 个 特定 值 标示 一 个 新 行 在 结果 表 中 已 经 有 了 。SQL 
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通过 检查 一 行 上 是 否 标 有 特殊 值 就 能 确定 该 行 以 前 是 否 加 过 。 如 果 有 ，SQL 假设 遇 到 环 ， 则 
停止 检索 进一步 的 结果 。 下 面 是 CYCLE 子 句 的 例子 : 
CYCLE staffNo, managerStaffNo 


SET cycleMark TO Y’ DEFAULT N’ 
USING cyclePath 


cycleMark 和 cyclePath 都 是 用 户 自 定义 的 列 名 ， 由 SQL 内 部 使 用 。cyclePath 是 
一 个 回 量 数组 ， 元 素 类 型 为 包含 循环 列表 中 所 有 列 的 行 类 型 (本 例 中 即 staffNo 和 
managerStaffNo)， 癌 量 长 度 大 于 等 于 结果 关系 的 行 数 。 满 足 查 询 的 行者 缓存 在 cyclePath 中 ， 
当 一 个 满足 查询 的 环 第 一 次 被 发 现 (根据 其 不 在 cyclePath 中 即 可 确定 ) 时 ，cycleMark 列 被 
置 “N”。 当 同一 行 再 次 被 发 现 (根据 其 已 经 在 cyclePath 中 即 可 确定 ) 时 ， 结 果 表 中 已 存在 
的 那 行 的 cycleMark 列 被 置 “Y " ， 说 明 这 行 开 始 循环 了 。 


本 章 小 结 

© SQL 语言 最 初 的 版 本 中 没有 编程 结构 ， 故 不 是 计算 完备 的 。 较 新 的 版 本 扩展 被 称 为 SQL/PSM 

(Persistent Stored Modules ， 永 久 存储 模块 )， 因 而 成 为 一 个 完全 的 程序 设计 语言 。 

SQL/PSM 支持 变量 定义 ， 提 供 赋值 语句 、 控 制 流 语句 (IF-THEN-ELSE-END, LOOP-EXIT WHEN- 

END LOOP, FOR-END LOOP, WHILE-END LOOP) 和 异常 。 

e 如 果 查 询 返回 一 行 且 仅 一 行 ,直接 用 SELECT 语句 即 可 。 为 了 处 理 那 些 返回 任意 数量 ( 零 个 、 一 个 

或 多 个 ) 行 的 查询 ，SQL 引入 了 游标 (cursor) 的 概念 ， 以 便 能 够 每 次 只 访问 查询 结果 中 的 一 行 。 实 

际 上 ， 游 标 就 像 是 一 个 指向 查询 结果 中 特定 行 的 指针 。 游 标 可 以 前 进 一 格 ， 以 便 访问 下 一 行 。 游 标 

在 使 用 之 前 必须 声明 并 打开 。 如 果 不 再 需要 使 用 它 ， 则 必须 将 它 关 闭 。 一 旦 打开 游标 ， 就 可 以 使 用 

FETCH 语句 ， 每 次 只 访问 查询 结果 中 的 一 行 ， 这 与 SELECT 语句 正好 相反 。 

子 程序 指 的 是 带 有 参数 并 能 被 调用 的 命名 PL/SQL 块 。PL/SQL 有 两 种 类 型 的 子 程序 : (存储 ) 过 程 

和 函数 。 过 程 和 函数 都 能 带 有 一 组 由 调用 程序 传递 给 它们 的 参数 ， 并 且 能 够 执行 一 系列 动作 。 它 们 

都 能 修改 和 返回 作为 参数 传递 给 它们 的 数据 。 两 者 之 间 的 不 同 在 于 : 函数 总 是 向 调用 者 返回 一 个 单 

独 的 值 ， 而 过 程 则 没有 这 个 限制 。 通 常 ， 如 果 不 是 仅 需 返回 一 个 值 ， 一 般 会 选择 使 用 过 程 。 

e 触发 器 定义 了 当 应 用 程序 中 发 生 某 种 事件 时 ， 数 据 库 应 该 执行 哪些 动作 。 触 发 器 也 可 以 用 来 增强 
引用 完整 性 约束 和 复杂 约束 或 者 是 审计 对 数据 进行 的 修改 。 触 发 需 基 于 事件 -条件 -动作 ( Event- 
Condition-Action, ECA) 模型 : 事件 (event 或 events) 触发 规则 ， 条 件 决定 动作 是 否 需 要 被 执行 ， 
动作 (action) 就 是 要 执行 的 操作 。 

© 触发 器 的 优点 包括 : 删除 了 多 余 代 码 ， 简 化 修改 ， 增 强 了 安全 性 ， 改 良 了 完整 性 ， 改 良 了 处 理 能 力 ， 
与 客户 / RGAE, AAT SG: 性 能 耗费 ， 级 联 效果 ， 无 法 调度 ， 可 移植 性 差 。 


思考 题 


8.1 说 明 什 么 是 “阻抗 失 配 ”"， 简 要 描述 SQL 如 何 解决 此 问题 。 
8.2 ”描述 PL/SQL 块 的 结构 。 

8.3 ”描述 PL/SQL 的 控制 语句 并 举例 说 明 。 

8.4 ”描述 PL/SQL 与 SQL 标准 的 差别 并 举例 说 明 。 

8.5 什么 是 SQL 的 游标 ? 举例 说 明 游 标的 使 用 。 
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8.6 什么 是 数据 库 触 发 器 ? 它 有 何 用 途 ? 

8.7 讨论 BEFORE、AFTER 和 INSTEAD OF 触发 器 的 差别 并 举例 说 明 。 
8.8 讨论 行 级 和 语句 级 触发 器 的 差别 并 举例 说 明 。 

8.9 讨论 数据 库 触 发 器 的 优 缺 点 。 


习题 
下 列 问 题 均 采用 第 4 章 习 题 中 的 Hotel 模式 。 
8.10 ”为 习题 6.7 一 习题 6.11 中 的 每 个 查询 创建 一 个 存储 过 程 。 
8.11 ”为 下 面 每 个 场景 创建 一 个 触发 器 : 
(a) 所 有 双人 间 的 价格 必须 大 于 100 BF. 
(b) 双人 间 的 价格 必须 大 于 最 贵 的 单 人 间 。 
(c) 在 指定 日 期 已 有 预订 的 房间 不 能 再 有 预订 。 
(d) 客人 不 能 在 重 秋 的 日 期 里 重复 预订 。 
(e) 维护 一 个 审计 表 ， 记 录 下 预订 了 伦敦 酒店 的 所 有 客人 的 姓名 和 地 址 (不 重复 存储 客人 信息 )。 


8.12 创建 一 个 INSTEAD OF 触发 器 ， 以 实现 对 下 列 视图 的 数据 捅 人 : 
CREATE VIEW LondonHotelRoom AS 
SELECT h.hotelNo, hoteiName, city, roomNo, type, price 


FROM Hotel h, Room r 
WHERE h.hotelNo = rhotelNo AND city = ‘London’ 


8.13 分析 你 正在 使 用 的 RDBMS ， 确 定 它 对 SQL 编程 结构 、 数 据 库 触发 器 和 递归 查询 提供 的 支持 。 


写 下 每 个 系统 与 SQL 标准 的 差别 。 
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| 第 9 章 


Database Systems: A Practical Approach to Design, Implementation, and Management, 6E 


对 象 关系 DBMS 





| 本 章 目 标 

本 章 我 们 主要 学 习 : 

© 高 级 数据 库 应 用 需求 

e 为 什么 目前 的 关系 DBMS 无 法 有 效 地 支持 高 级 数据 库 应 用 
在 关系 数据 库 中 存储 对 象 的 有 关 问 题 
如 何 扩展 关系 模型 以 支持 高 级 数据 库 应 用 
最 新 SQL 标准 SQL:2011 中 的 面向 对 象 的 特性 
m 行 类 型 
用 户 自 定义 类 型 和 用 户 目 定 义 例 程 
继承 
引用 类 型 和 对 象 标识 
集 类 型 (ARRAY, MULTISET, SET 和 LIST) 
扩展 SQL 语言 使 其 计算 完备 
触发 器 
KAMA: 二 进 制 大 对 象 (Binary Large Object, BLOB) 和 字符 大 对 象 (Character 
Large Object, CLOB) 

m iğ 

e Oracle 的 一 些 面 向 对 象 的 扩展 


面向 对 象 是 一 种 软件 构建 的 方法 ， 对 解决 软件 开发 过 程 中 的 一 些 典 型 问题 来 说 ， 面 向 对 象 
是 一 种 非常 有 前 景 的 方法 。 对 象 技术 背后 隐 含 的 基本 概念 是 : 软件 应 该 尽 可 能 地 由 标准 的 、 可 
重用 的 组 件 构 成 。 传 统 上 ， 软 件 工程 和 数据 库 管 理 是 作为 相互 独立 的 学 科 存 在 的 。 数 据 库 技 
术 专 注 于 软件 静态 的 一 面 一 一 信息 存储 ， 而 软件 工程 则 关注 软件 的 动态 的 一 面 。 随 着 第 三 代 
数据 库 管理 系统 ， 即 面向 对 象 的 数据 库 管理 系统 (Object-Oriented Database Management 
System, OODBMS) 和 和 对象 关系 数据 库 管 理 系统 ( Object-Relational Database Management System, 
ORDBMS) 的 提出 ， 这 两 个 学 科 已 经 相互 结合 ， 人 允许 同时 对 数据 及 其 处 理 过 程 进行 建 模 。 

然而 ， 对 于 下 一 代 DBMS 目前 还 存在 着 很 大 的 争议 。 在 过 去 的 20 多 年 里 ， 关 系 系统 所 
取得 的 成 果 是 有 目 共 睹 的 ， 传 统 主 义 者 认为 扩展 关系 模型 以 支持 附加 功能 ( 面 回 对 象 ) 就 足 
人 够 了 了 。 而 另 一 些 人 则 认为 ， 底 层 的 关系 模型 不 足以 处 理 复杂 的 应 用 ， 例 如 计算 机 辅助 设计 、 
计算 机 辅助 软件 工程 和 地 理 信 息 系统 。 本 章 将 讨论 ORDBMS， 重 点 介绍 SQL 的 扩充 。 将 面 
向 对 象 的 概念 集成 到 关系 系统 被 认为 是 支持 高 级 数据 库 应 用 的 演进 法 。 第 27 ~ 28 章 将 讨论 
OODBMS, 将 面向 对 象 的 概念 与 数据 库 系统 结合 起 来 被 认为 是 革新 法 。 为 了 系统 地 讨论 问 
题 ， 本 章 我 们 首先 考虑 高 级 数据 库 应 用 的 特征 以 及 为 什么 RDBMS 不 适合 处 理 这 些 应 用 。 对 
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面向 对 象 概 念 不 熟悉 的 读者 请 参阅 附录 Ko 


| 本 章 结构 

9.1 节 讨 论 高 级 数据 库 应 用 需求 ， 这 些 需求 已 经 变 得 越 来 越 平常 。9.2 节 讨 论 为 什么 传统 
的 RDBMS 不 能 很 好 地 支持 这 些 新 应 用 。9.3 节 分 析 在 关系 数据 库 中 存储 对 象 的 相关 问题 。9.4 
节 讨 论 ORDBMS 的 背景 以 及 它 所 适宜 的 应 用 类 型 。9.5 节 详 细 回 顾 2011 年 12 月 发 布 的 标 
准 SQL:2011 的 主要 特性 。 最 后 ，9.6 节 讨 论 Oracle (商品 化 ORDBMS) 中 已 经 添加 的 一 些 
面向 对 象 的 扩展 。 

为 了 便于 本 章 学 习 ， 读者 应 熟悉 附录 K 给 出 的 面向 对 象 概念 。 本 章 使 用 的 例子 还 是 来 

自 11.4 节 和 和 附录 A 中 的 DreamHome 案例 。 


9.1 高 级 数据 库 应 用 


在 最 近 的 十 年 里 ， 计 算 机 工业 发 生 了 巨大 的 变化 。 就 数据 库 系统 而 言 ， 可 以 看 到 
RDBMS 已 经 被 广泛 应 用 于 传统 行业 ， 例 如 订单 处 理 、 库 存 控制 、 银 行业 务 和 航班 预订 ， 等 
等 。 然 而 ， 对 于 那些 与 传统 行业 数据 库 应 用 差别 较 大 的 应 用 来 说 ， 现 有 的 RDBMS 已 表现 出 
明显 的 不 适应 。 这 些 应 用 包括 : 

e 计算 机 辅助 设计 (CAD) 
计算 机 辅助 制造 (CAM) 
计算 机 辅助 软件 工程 (CASE) 

网 络 管理 系统 

办 公信 息 系统 (OIS) 和 多 媒体 系统 
数字 出 版 

地 理 信息 系统 (GIS) 

© 交互 式 的 和 动态 的 Web 站 点 
计算 机 辅助 设计 (CAD) 

CAD 数据 库 中 存储 着 与 机 械 或 者 电子 设计 相关 的 数据 ， 例 如 建筑 物 、 飞 行 器 以 及 集成 
电路 必 片 。 这 类 设计 具有 一 些 共同 的 特征 : 

o 设计 数据 可 能 覆盖 多 种 类 型 ， 而 每 种 类 型 的 实例 数量 却 不 大 。 传 统 的 数据 库 正 好 
与 之 相反 。 例 如 ，DreamHome 数据 库 由 大 约 12 个 关系 组 成 ， 其 中 一 些 关 系 ， 比 如 
PropertyForRent, Client 和 Viewing 则 可 能 包含 成 千 上 万 个 元 组 。 
设计 规模 巨大 ， 可 能 包含 几 百 万 个 部 件 ， 通 常 是 由 许多 相互 依赖 的 子 系统 组 成 。 

e 设计 不 是 静止 的 ， 而 是 随 着 时 间 演 化 。 当 某 一 设计 发 生 改变 时 ， 其 含义 必须 传播 到 
所 有 的 设计 表示 中 去 。 设 计 的 动态 特性 意味 着 某 些 动作 在 设计 之 初 是 无 法 预见 的 。 
由 于 拓扑 结构 或 功能 的 关联 、 容 错 等 因素 的 影响 ， 更 新 的 后 果 十 分 复杂 。 一 个 修改 
很 可 能 会 影响 到 大 量 的 设计 对 象 。 

通常 情况 下 ， 都 会 考虑 到 每 个 组 件 有 多 种 设计 选择 ， 因 此 要 为 每 一 个 组 件 维护 一 个 
正确 的 版 本 。 这 就 涉及 某 种 形式 的 版 本 控制 和 配置 管理 。 

可 能 有 数 以 百 计 的 人 员 参 与 7 了 设计， 并 且 他 们 可 能 在 某 个 大 型 设计 的 多 个 版 本 上 
并 行 地 工作 。 即 使 这 样 ， 最 终 产品 必须 是 一 致 的 、 协 同 的 。 这 有 时 被 称 为 协同 工程 


(cooperative engineering ) 。 
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计算 机 辅助 制造 (CAM) 

CAM 数据 库 中 除了 存储 着 与 CAD 数据 库 系 统 类 似 的 数据 以 外 ， 还 包含 与 离散 的 产品 
(如 装配 线 上 的 汽车 ) 和 连续 的 产品 (如 化 学 化 合 物 ) 相关 的 数据 。 例 如 ， 在 化 学 制品 的 生产 
过 程 中 ， 可 能 有 监视 系统 状态 信息 (例如 反应 堆 容 器 的 温度 、 流 率 和 产量 ) 的 应 用 软件 ， 还 
可 能 有 控制 各 种 各 样 物理 过 程 (例如 打开 阀门 、 给 反应 堆 容 器 加 热 和 增加 冷却 系统 的 流量 ) 
的 应 用 软件 。 应 用 通常 是 按照 层次 结构 组 织 的 ， 高 层 应 用 监视 整个 工厂 ， 低 层 应 用 监视 单个 
生产 过 程 。 应 用 必须 能 够 实时 响应 ， 并 且 能 够 对 过 程 进行 调整 ， 在 保证 容错 的 前 提 下 保持 最 
优 的 性 能 。 应 用 将 标准 算法 与 定制 规则 相 结 合 ， 以 便 对 不 同 的 情况 做 出 反应 。 操 作 人 员 可 以 
根据 系统 维护 的 复杂 历史 数据 ， 间 或 对 这 些 规则 进行 修改 以 谋求 性 能 最 优 。 在 这 种 情况 下 ， 
系统 必须 维护 大 量 的 层次 结构 的 数据 ， 还 必须 维护 这 些 数据 之 间 的 复杂 联系 。 此 外 ， 系 统 必 
须 能 够 快速 定位 需要 查看 的 数据 并 对 变化 做 出 反应 。 
计算 机 辅助 软件 工程 (CASE) 

CASE 数据 库存 储 着 与 软件 开发 生命 周期 的 各 个 阶段 相关 的 数据 : 规划 、 需 求 收集 与 
分 析 、 设 计 、 实 现 、 测 试 、 维 护 和 文档 化 。 与 CAD 类 似 ， 设 计 规 模 可 能 非常 庞大 ， 并 且 通 
常 为 协同 工程 。 例 如 ， 软 件 配置 管理 工具 支持 项 目 设计 、 代 码 和 文档 的 协作 共享 。 软 件 配置 管 
理工 具 还 要 对 这 些 组 件 之 间 的 相关 性 进行 追踪 ， 以 辅助 变更 管理 。 项 目 管理 工具 有 助 于 协调 各 
种 项 目 管理 活动 ， 例 如 对 高 度 复杂 的 、 相 互 依赖 的 任务 进行 进度 安排 、 成 本 估算 和 进度 监控 。 
网 络 管理 系统 

网 络 管理 系统 协调 计算 机 网 络 中 通信 服务 的 传递 。 这 些 系统 执行 诸如 网 络 路 由 管理 、 问 
题 管理 和 网 络 规划 等 任务 。 和 前 面 讨论 的 化 学 制品 生产 的 例子 相似 ， 这 些 系 统 也 要 处 理 复 杂 
的 数据 ， 并 且 要 求实 时 执行 和 连续 操作 。 例 如 ， 一 次 电话 呼叫 可 能 涉及 一 系列 网 络 交换 设 
备 ， 将 一 个 消息 从 发 送 者 传送 给 接收 者 : 

Tf ROR BROT ROR ROT ROR ROT A 
其 中 每 一 个 节点 (Node) 代表 网 络 设备 上 的 一 个 端口 ， 每 一 个 链 路 (Link) 代表 保留 给 该 连 
接 的 一 小 段 带 宽 。 然 而 ， 一 个 节点 可 能 同时 参与 了 多 个 不 同 的 连接 ， 因 此 创建 的 任何 数据 库 
都 必须 能 够 对 复杂 的 关系 图 进行 管理 。 为 了 实现 路 由 连接 、 问 题 诊断 和 负载 平衡 ， 网 络 管理 
系统 必须 具备 在 复杂 的 图 中 实时 移动 的 能 力 。 
办 公信 息 系 统 (OIS) 和 多 媒体 系统 

OIS 数据 库存 储 了 企业 中 与 计算 机 控制 的 那些 信息 相关 的 数据 ,包括 电子 邮件 、 文 档 、 
发 票 等 。 为 了 对 这 个 领域 提供 更 好 的 支持 ， 除 了 名 称 、 地 址 、 时 间 和 资金 以 外 ， 还 需要 处 理 
更 广泛 的 数据 类 型 。 现 在 最 新 的 系统 能 够 处 理 自 由 格式 的 文本 、 照 片 、 图 表 、 音 频 和 视频 序 
列 。 例 如 ， 一 个 多 媒体 文档 可 能 包含 了 文本 、 照 片 、 电 子 数 据 表 和 语音 解说 。 因 此 就 需要 文 
档 具有 可 以 表达 这 些 数据 的 特殊 的 结构 ， 我 们 可 以 使 用 标记 语言 来 描述 ， 例 如 SGML (标准 
化 通用 标记 语言 )、HTML ( 超 文本 标记 语言 ) 或 者 XML (可 扩展 的 标记 语言 ) 等 ， 详 见 第 
30 章 的 讨论 。 

利用 电子 邮件 和 公告 板 等 基于 Internet 技术 的 系统 ， 文 档 可 以 在 许多 用 户 间 共享 9。 而 
且 ， 这 些 应 用 需要 存储 比 仅 由 数字 和 字符 串 组 成 的 元 组 结构 更 加 丰富 的 数据 。 另 外 ， 使 用 电 


O 正如 许多 观察 家 所 评论 的 那样 ， 对 数据 库 系 统 的 一 个 潜在 的 致命 批判 是 ,世界 上 最 大 的 “数据 库 ” 一 一 
万 维 网 一 一 开发 之 初 完全 没有 用 到 数据 库 技术 。 我 们 将 在 第 29 章 讨论 万 维 网 与 DBMS 的 集成 。 
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子 设备 手写 输入 的 需求 也 日 益 上 升 。 尽 管 许多 手写 信息 可 以 使 用 手写 分 析 技 术 转换 为 ASCIl 
文本 ， 但 大 多 数 手写 信息 还 是 很 难 表述 的 。 除 了 文字 以 外 ; 手写 数据 还 可 能 包括 草图 、 图 
表 等 。 
在 DreamHouse 案例 中 ， 可 以 发 现 一 些 多 媒体 处 理 信息 的 需求 : | 
© 图 像 数据 。 客 户 可 能 会 要 求 查询 待 出 租房 产 的 图 像 数 据 库 。 其 中 某 些 查询 也 许 用 简 
单 的 文本 就 可 以 描绘 出 客户 关于 租赁 房屋 的 样式 的 意向 。 但 另外 一 些 情形 下 ， 如 果 
能 给 出 客户 意向 的 图 像 描 述 (例如 凸 窗 、 内 部 檐 口 或 屋顶 花园 )， 就 会 有 助 于 客户 的 
查询 。 
© 视频 数据 。 客 户 可 能 还 会 要 求 查询 待 出 租房 产 的 视频 数据 库 。 同 样 ， 某 些 查 询 只 使 
用 文本 的 描述 就 能 够 勾勒 出 客户 想 要 租赁 的 房产 的 视频 图 像 。 但 是 在 另外 一 些 情况 
下 ， 能 够 提供 客户 想 要 租赁 房产 的 环境 (例如 海景 或 者 环绕 的 群 山 ) 的 视频 ， 则 会 有 
助 于 客户 的 查询 。 
音频 数据 。 客 户 可 能 也 会 查询 可 供出 租房 产 的 音频 数据 库 。 与 前 两 种 情况 一 样 ， 革 
些 查询 简单 地 用 文本 的 描述 就 可 以 刻画 客户 要 租赁 的 房产 了 。 但 是 ， 在 某 些 情形 下 ， 
给 客户 提供 其 想 要 租赁 房产 的 音频 特征 资料 (例如 ， 附 近 交 通 的 噪音 水 平 ) 可 能 会 
更 好 。 
手写 数据 。 某 位 员工 在 巡视 待 出 租房 产 时 做 过 一 些 记 录 。 一 段 时 间 后 ， 他 可 能 会 希 
望 通过 查询 数据 找到 位 于 Novar Drive 的 带 有 枯木 的 那 座 公 寅 的 所 有 记录 信息 。 
数字 出 版 
在 未 来 十 年 里 ， 根 据 商业 惯例 ， 出 版 业 可 能 会 经 历 意义 深远 的 变革 。 以 电子 的 形式 存储 
书籍 、 杂 志 、 报 纸 和 论文 并 且 通 过 高 速 网 络 传递 给 消费 者 的 方式 正在 成 为 现实 。 在 办 公信 息 
系统 的 支持 下 ， 数 字 出 版 正在 扩展 为 能 够 处 理 包 括 文本 、 音 频 、 图 像 、 视 频数 据 和 动画 在 内 
的 多 媒体 文档 。 在 某 些 情况 下 ， 在 线 出 版 信息 的 数据 量 之 庞大 可 能 要 以 拍 字 节 (petabyte) (1 
HAF = 10" 字 节 ) 为 单位 ， 这 是 DBMS 有 史 以 来 管理 过 的 最 大 型 的 数据 库 。 
地 理 信 息 系 统 (GIS) 


GIS 数据 库 中 存储 着 各 种 类 型 的 空间 和 时 间 信 息 ， 例 如 用 于 土地 管理 和 水 下 资源 开发 的 
数据 。GIS 系统 中 的 大 部 分 数据 来 自 勘 测 和 卫星 图 片 ， 数据 量 非常 大 。 对 GIS 数据 库 的 搜索 
涉及 利用 先进 的 模式 识别 技术 ， 根 据 形 状 、 颜 色 、 纹 理 等 对 某 些 特征 进行 确认 。 

例如 ，EOS (Earth Observing System， 地 球 观测 系统 ) 是 由 NASA 在 20 世纪 90 FRE 
射 的 一 组 卫星 ，EOS 收集 的 信息 将 支持 科学 家 对 地 球 的 大 气 、 海 洋 和 陆地 的 长 期 发 展 趋 势 进 
行 研 究 。 预 计 这 些 卫星 每 年 返回 的 信息 超过 1/3 拍 字 节 。 这 些 数据 将 与 其 他 数据 源 综合 ， 存 
储 到 EOSDIS ( EOS Data and Information System, EOS 数据 和 信息 系统 ) 中 。EOSDIS 将 同 
时 为 科学 家 及 其 他 人 员 提 供 所 需 信息 。 例 如 ， 学 生 将 可 以 访问 EOSDIS 查看 世界 气候 模式 的 
模拟 。 这 种 数据 库 的 巨大 规模 ， 以 及 需要 具备 支持 数 以 千 计 的 用 户 同时 提出 的 大 量 信息 查询 
的 能 力 ， 都 为 DBMS 带 来 诸多 挑战 。 
交互 式 的 和 动态 的 Web 站 点 

考虑 再 有 在 线 目 录 的 一 个 服装 销售 Web 站 点 。 该 站 点 保留 了 访问 者 偏爱 信息 的 数据 ， 
并 且 人 允许 访问 者 : 

e 浏览 服装 目录 中 所 有 款式 的 缩 略 图 像 ， 选 中 其 一 就 可 以 看 到 完全 大 小 的 图 像 及 其 相 
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关 的 详细 信息 。 

搜索 符合 用 户 定义 标准 的 款式 。 

获得 一 个 基于 定制 规格 (例如 ， 颜 色 、 尺 码 、 质 地 ) 的 任意 款式 的 服装 的 3D 透视 图 。 
根据 移动 、 照 明 、 背 景 、 场 合 等 调整 透视 图 。 

从 工具 条 的 选项 中 选择 配饰 ， 为 服装 进行 搭配 。 

选择 一 个 画外音 解说 ， 获 得 所 选项 目 更 多 的 详细 信息 。 

查看 带 有 相应 折扣 的 流水 账单 。 

通过 安全 在 线 交 易 技术 完成 购买 活动 。 

此 类 应 用 的 要 求 与 前 述 的 一 些 高 级 应 用 并 没有 什么 不 同 : 需要 处 理 多 媒体 (文本 、 音 频 、 
图 像 、 视 频数 据 以 及 动画 ) 的 内 容 ， 并 且 能 够 根据 用 户 的 喜好 和 用 户 的 选择 交互 式 地 进行 修 
改 。 但 是 除了 要 人 处理 复杂 的 数据 以 外 ， 站 点 因为 要 支持 3D 透视 图 而 增加 了 复杂 度 。 一 些 人 
争论 说 ， 在 这 种 情况 下 数据 库 并 不 仅仅 是 为 访问 者 提供 信息 ， 而 且 积 极地 参与 了 销售 、 动 态 
地 提供 定制 信息 以 及 为 到 访 者 创造 一 种 友好 的 氛围 (King，1997 )。 

在 第 29 和 30 章 将 看 到 ，Web 为 数据 管理 提供 了 一 种 相对 较 新 的 范 型 ， 而 且 还 出 现 了 
像 XML 这 样 前 景 展 好 的 语言 ， 尤 其 是 对 电子 商务 市 场 。 据 Forrester 咨询 和 调查 公司 (The 
Forrester Research Group and eMarketer) 报道 ，2011 年 美国 线 上 零售 额 已 近 2250 亿美 元 ， 
计划 2016 年 将 增长 到 3620 亿美 元 ， 其 中 计算 机 和 消费 类 电 需 占 22% WT A, He 
饰品 占 20%。 全 球 B2B (business-to-business) 市 场 期 望 超过 B2C ( business-to-consumer ) 
市 场 ， 在 未 来 的 岁月 里 ，B2B 总 收入 可 望 超过 B2C 总 收入 数 倍 。 各 家 公司 通过 它们 全 球 发 
布 的 Web 网 站 可 拥有 世界 各 地 近 25 亿 的 在 线 消费 者 ( 占 世 界 人 口 的 35%)。 随 者 Internet 利 
用 率 的 提高 以 及 技术 的 日 趋 先 进 和 成 熟 ， 我 们 可 以 预见 Web 站 点 和 B2B 交易 将 处 理 更 复杂 
和 更 关联 的 数据 。 

其 他 一 些 高 级 的 数据 库 应 用 包括 : 

e 科学 和 医学 应 用 。 存 储 用 于 表示 类 似 人 工 合成 化 合 物 的 分 子 模型 和 基因 材料 这 类 系 

统 的 复杂 数据 。 
© 专家 系统 。 存 储 人 工 智能 CAL) 应 用 的 知识 和 规则 。 
© 其 他 涉及 复杂 的 、 紧 密 相关 联 的 对 象 和 过 程 化 数据 的 应 用 。 


9.2 RDBMS 的 缺点 


在 第 4 章 我 们 已 经 讨论 过 ， 基 于 一 阶 谓 词 逻 表 9-1 关系 DBMS 缺点 概览 
辑 的 关系 模型 具有 坚固 的 理论 基础 。 该 理论 支撑 着 缺点 
SQL 一 一 一 种 说 明 式 语言 的 发 展 ，SQL 现在 已 经 成 对 “现实 世界 ”实体 的 表现 力 不 足 
为 定义 和 操作 关系 数据 库 的 标准 语言 。 关 系 模型 的 其 。 语义 过 载 
他 优点 还 包括 它 的 简洁 性 、 对 联机 事务 处 理 ( OLTP) ” 对 完整 性 和 企业 约束 的 支持 不 足 
的 适宜 性 及 其 对 数据 独立 性 的 支持 。 然 而 ， 关 系数 pea 
据 模型 ， 尤 其 是 关系 的 DBMS， 并 不 是 完美 无 缺 的 。 yi men aca 
K 9-1 列 出 了 经 常 被 面向 对 象 方法 的 支持 者 谈 及 的 一 pake 
些 比较 显著 的 缺点 。 本 节 将 讨论 这 些 缺 点 ， 由 读者 自 RDBMS 中 与 并 发 、 模 式 修 改 、 弱 导航 式 
行 判 断 这 些 缺 点 是 和 否 成 立 。 访问 等 相关 的 其 他 问题 
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对 “现实 世界 ”实体 的 表现 力 不 足 

规范 化 的 过 程 通常 会 导致 产生 无 法 与 “现实 世界 ”的 实体 相对 应 的 关系 。“ 现 实 世 界 ” 
的 实体 被 低 效 地 分 割 到 许多 关系 中 ， 其 物理 表示 也 与 这 些 关 系 相 对 应 ， 并 导致 在 查询 处 理 中 
不 得 不 使 用 许多 连接 。 正 如 我 们 在 第 23 章 看 到 的 ， 连 接 是 代价 最 高 的 运算 之 一 。 
语义 过 载 

关系 模型 只 采用 了 一 种 结构 ， 即 关系 来 表示 数据 和 数据 之 间 的 联系 。 例 如 ， 为 了 表示 实 
体 A 和 实体 B 之 间 的 多 对 多 的 联系 ， 我 们 创建 了 三 个 关系 ， 其 中 两 个 分 别 表示 实体 A M B, 
另外 一 个 表示 A 和 B 的 联系 。 再 没有 什么 机 制 可 以 用 来 区 分 实体 和 联系 ， 或 者 区 分 实体 之 
间 存 在 的 不 同 种 类 的 联系 。 例 如 ， 一 个 一 对 多 的 联系 可 能 是 Has, Owns 或 者 Manages 等 。 
如 果 能 够 加 以 区 别 的 话 ， 就 有 可 能 将 语义 引入 运算 中 。 因 此 我 们 说 关系 模型 是 语义 过 载 的 。 

人 们 已 经 进行 了 很 多 努力 ， 试 图 使 用 语义 数据 模型 解决 这 个 问题 。 语 义 数 据 模型 就 是 能 
够 表示 数据 的 更 多 意义 的 模型 。 有 兴趣 的 读者 可 以 参阅 Hull and King (1987) 和 Peckham 
and Maryanski ( 1988 )。 然 而 ， 关 系 模 型 并 不 是 完全 没有 语义 特性 。 例 如 ， 它 具有 域 和 关键 
字 (参见 4.2 节 )， 以 及 函数 依赖 、 多 值 依赖 和 连接 依赖 (参见 第 14 和 15 章 )。 
对 完整 性 和 一 般 性 业务 约束 的 支持 不 足 

完整 性 指 的 是 存储 的 数据 的 有 效 性 和 一 臻 性。 完整 性 通常 是 以 约束 的 方式 表示 的 ， 即 
不 允许 数据 库 违反 的 一 致 性 规则 。4.3 节 已 经 介绍 了 实体 完整 性 和 引用 完整 性 的 概念 ， 并 在 
4.2.1 节 介 绍 了 域 ， 域 也 可 视 为 一 种 类 型 的 约束 。 遗 憾 的 是 ， 许 多 商品 化 系统 并 不 完全 文 持 
这 些 约束 ， 因 而 必须 在 应 用 程序 中 创建 这 些 约束 。 当 然 ， 这 样 做 是 危险 的 ， 并且 可 能 导致 重 
复 劳 动 ， 更 糟糕 的 是 可 能 导致 数据 不 一 致 。 更 进一步 ， 夺 在 关系 模型 中 不 文 持 一 般 性 业务 约 
束 ， 也 就 意味 着 必须 在 DBMS 或 者 应 用 程序 中 创建 这 些 约束 。 

在 第 6 章 和 第 7 章 已 经 看 到 ，SQL 标准 部 分 地 解决 了 这 一 不 足 ， 即 允许 用 数据 定义 语言 
(DDL) 定义 其 中 某 些 类 型 的 约束 。 
间 质 的 数据 结构 

关系 模型 被 认为 是 水 平和 垂直 均 同 质 的 。 水 平 同 质 是 指 关 系 的 每 一 个 元 组 都 必须 由 相同 
的 属性 组 成 。 垂 直 同 构 则 是 指 关 系 的 某 一 列 中 的 值 必须 全 都 来 自 同一 个 域 。 此 外 ， 行 列 相 交 
处 必须 是 一 个 原子 值 。 这 种 固定 的 结构 对 许多 具有 复杂 结构 的 “现实 世界 ”的 对 象 来 说 限制 
性 太 强 ， 会 导致 不 自然 的 连接 ， 而 连接 运算 非常 低 效 ， 正 如 前 所 述 。 赞 同 关 系数 据 模型 的 一 
方 则 争辩 说 对 称 结构 正 是 关系 模型 的 优点 之 一 。 

关于 复杂 数据 和 极其 复杂 联系 的 一 个 经 典 示 例 就 是 部 件 爆 炸 ， 部 件 爆炸 发 生 的 情形 
为 : 当 我 们 表示 某 个 对 象 时 ， 例 如 飞机 ， 该 对 象 由 许多 部 件 以 及 许多 组 合 部 件 构成 ， 而 这 
些 部 件 和 组 合 部 件 又 是 由 其 他 的 部 件 和 组 合 部 件 组 成 的 ， 如 此 往复 。 这 一 缺陷 导致 了 人 
们 对 复杂 对 象 或 者 非 第 一 范式 (non-first normal form , NF2) 数据 库 系 统 的 研究 ， 人 参见 
Jaeschke and Schek ( 1982 ) 和 Bancilhon and Khoshafian ( 1989 ) 。 在 后 一 篇 论文 中 ， 对 
象 被 递归 地 定义 为 : 

C1) 每 个 原子 值 (例如 整数 、 浮 点 数 、 字 符 串 ) 都 是 一 个 对 象 。 

(2) 4 ar, ar, …, an 是 不 同 的 属性 名 ，01, 0;,…, On 是 对 象 ， 则 [ ai: 01, az: 02, …, an On | 
是 一 个 元 组 对 象 。 

(3) 如 果 01, O2, °; On 是 对 象 ， 则 S= foi, 02, °°"; On? 是 集合 对 象 。 
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在 这 个 模型 中 ， 下列 对 象 都 是 合法 的 对 象 : 


原子 对 象 B003, John, Glasgow 

集 {SG37, SG14, SG5} 

元 组 [branchNo: B003, street: 163 Main St, city: Glasgow] 

分 层 元 组 [branchNo: B003, street: 163 Main St, city: Glasgow, staff: 
{SG37, SG14, SG5}] 

元 组 集 {[branchNo: B003, street: 163 Main St, city: Glasgow], 
[branchNo: B005, street: 22 Deer Rd, city: London]} 

th BK F {[branchNo: B003, street: 163 Main St, city: Glasgow, staff: 


{SG37, SG14, SG5}], 
[branchNo: B005, street: 22 Deer Rd, city: London, staff: 
{SL21,SL41}]} 
现在 ， 许 多 RDBMS 都 可 以 存储 二 进 制 大 对 象 ( Binary Large Object, BLOB). BLOB 
可 以 是 任何 二 进 制 信息 的 数据 值 ， 用 以 表示 图 像 、 数 字 化 视 音 频 序列 、 过 程 或 者 任何 大 的 无 
结构 对 象 。DBMS 并 不 知道 BLOB 的 内 容 或 其 内 部 结构 。 这 就 使 得 DBMS 不 能 对 原本 内 
涵 丰 富 且 为 结构 化 的 数据 类 型 进行 查询 和 运算 。 通 常 ， 数 据 库 并 不 直接 管理 这 些 信息 ， 而 
是 仅仅 包含 了 一 个 指向 该 文件 的 引用 。 使 用 BLOB 并 不 是 一 个 很 好 的 解决 方案 ， 并 且 将 这 
些 信息 存储 在 外 部 文件 中 将 失去 许多 由 DBMS 自然 提供 的 保护 。 更 重要 的 是 ，BLOB 不 能 
包含 其 他 的 BLOB ， 因 此 它们 不 具备 组 合 对 象 的 形式 。 此 外 ，BLOB 通常 会 忽略 对 对 和 象 的 
许多 操作 。 例 如 ， 一 幅 图 片 可 以 作为 一 个 BLOB 存储 在 某 些 关系 DBMS 中 。 但 是 ， 图 片 
也 仅 能 被 存储 和 显示 ， 而 不 可 能 对 图 片 的 内 部 结构 进行 操作 ， 也 不 可 能 显示 或 者 操作 图 片 
的 一 部 分 。 
受 限 的 操作 
关系 模型 只 有 一 组 固定 的 操作 ， 比 如 面 回 集合 或 元 组 的 操作 以 及 SQL 规范 支持 的 其 他 
操作 。 可 是 ，SQL 不 允许 定义 新 的 操作 。 这 样 对 “现实 世界 ”对 象 行为 的 模拟 也 就 产生 了 很 
大 的 限制 。 例 如 ， 一 个 GIS 应 用 通常 会 用 到 点 、 线 、 一 组 线 、 多 边 形 ， 并 需要 支持 计算 距 
离 、 判 断 是 否 相 交 和 是 否 包含 等 运算 。 
难以 处 理 递 归 查 询 
关系 模型 要 求 数据 为 原子 的 ， 故 不 能 出 现 重复 组 。 因 此 极 难处 理 递 归 查 询 ， 也 就 是 关系 
跟 它 自己 的 (直接 或 间接 ) 关系 的 查询 。 考 虑 图 9-1a 中 简化 了 的 关系 Staff, Staff F T A 
工 的 编号 及 其 经 理 的 编号 。 我 们 怎样 才能 找 出 所 有 直接 或 间接 地 管理 着 员工 S005 的 经 理 ? 
为 了 找 出 这 种 分 层 结构 的 前 两 层 ， 我 们 可 以 执行 下 列 语句 : 


SELECT managerStaffNo 

FROM Staff 

WHERE staffNo = ‘S005’ 

UNION 

SELECT managerStaffNo 

FROM Staff 

WHERE staffNo = 
(SELECT managerStaffNo 
FROM Staff 
WHERE staffNo = S005’); 


我 们 可 以 很 容易 地 扩展 这 个 方法 ， 直 至 找到 该 查询 的 全 部 答案 。 对 于 这 个 特殊 的 例子 ， 
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这 种 方法 是 有 效 的 ， 因 为 我 们 知道 这 个 层次 结构 中 必须 处 理 的 层 数 。 但 是 ， 如 果 是 一 个 更 一 
般 化 的 查询 ,例如 “对 于 每 一 位 员工 ， 找 出 所 有 直接 或 间接 地 管理 着 该 员工 的 经 理 ”"， 则 这 
种 方法 是 不 可 能 使 用 交互 式 SQL 语句 实现 的 。 为 了 解决 这 个 间 题 ， 可 将 SQL 语言 通信 一 种 
高 级 的 编程 语言 中 ， 而 后 者 提供 了 迭代 结构 (参见 附录 I)。 并 且 ， 许 多 RDBMS 都 提供 了 一 
个 具有 类 似 结构 的 报表 书写 器 。 在 这 两 种 情况 下 ， 都 是 由 应 用 程序 而 不 是 由 系统 内 部 提供 所 
需 的 功能 。 

人 们 已 经 提出 了 用 于 处 理 此 类 查询 的 一 种 关系 代数 的 扩展 ， 即 被 称 为 传递 闭 包 
(transitive closure) 或 者 递归 闭 包 (recursive closure) 的 一 元 运算 (Merrett, 1984 ): 


传递 闭 包 | 包含 了 在 相同 的 域 上 定义 的 属性 (A, A) 的 关系 及 的 传递 闭 包 ， 由 关系 及 以 
及 根据 传递 性 相继 导出 的 所 有 元 组 构成 ， 即 若 (a,b) 和 (b,c) 是 R 的 元 组 ， 则 元 组 (a, c) 
也 被 添加 到 结果 中 去 。 
该 操作 不 可 能 由 固定 个 数 的 关系 代数 运算 实现 ， 而 是 需要 循环 执行 连接 、 投 影 和 合并 运 
算 。 对 简化 了 的 关系 Staff 执行 传递 闭 包 运算 的 结果 如 图 9-1b 所 示 。 


$004 





a) 简化 了 的 关系 Staff 





b ) 关系 Staff 的 传递 闭 包 


阻抗 失 配 
6.1 节 提 到 了 SQL-92 不 具备 计算 完备 性 。RDBMS 的 大 多 数 数据 操作 语言 (DML) 都 存 
在 这 个 问题 。 为 了 解决 这 个 问题 并 且 提 供 更 多 的 灵活 性 ，SQL 标准 支持 能 人 式 SQL， 以 便 
开发 更 加 复杂 的 数据 库 应 用 (参见 附录 1)。 然 而 ， 这 种 方式 因 混 合 两 种 编程 范 型 又 带 来 了 阻 
抗 失 配 (impedance mismatch) 的 问题 : 
e SQL 是 一 种 说 明 性 语言 ， 它 能 处 理 数据 行 的 集合 ， 而 C 一 类 的 高 级 语言 是 过 程 性 语 
A, 一 次 只 能 处 理 一 个 数据 行 。 
e SQL 与 各 种 3GL 采用 不 同 的 模型 表示 数据 。 例 如 ，SQL 语言 有 预定 义 的 数据 类 型 
Date 和 Interval， 这 在 传统 的 编程 语言 中 是 没有 的 。 因 此 不 得 不 在 应 用 程序 中 进行 转 
换 ， 这 无 论 是 对 编程 还 是 运行 时 资源 的 使 用 来 说 都 是 低 效 的 。 据 估算 ， 在 编程 时 要 
耗费 多 达 30% 的 精力 和 代码 量 用 于 此 类 转换 ( Atkinson 等 ，1983 )。 进 而 ， 由 于 同 
时 使 用 着 两 个 不 同 的 类 型 系统 ， 要 目 动 地 完成 应 用 程序 的 类 型 检查 也 是 不 可 能 的 。 
有 观点 认为 ， 不 应 该 用 行 级 的 面 回 对 象 的 语言 代替 关系 语言 作为 这 一 问题 的 解决 方案 ， 
而 是 应 该 在 编程 语言 中 引入 集合 级 ( set-level) 的 功能 (Date，2000 )。 而 OODBMS 的 根本 
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就 在 于 它 要 在 DBMS 的 数据 模型 和 宿主 编程 语言 之 间 提 供 一 种 更 加 无 缝 的 集成 。 我 们 将 在 
第 27 章 继续 讨论 这 个 问题 。 
RDBMS 的 其 他 问题 

e 商业 处 理 中 的 事务 通常 是 短 事务 ， 并 发 控制 原 语 和 协议 ， 例 如 两 段 锁 并 不 十 分 适 于 
处 理 长 事务 ， 而 对 复杂 的 设计 对 象 来 说 ,长 事务 是 很 普遍 的 (参见 22.4 节 )。 
模式 修改 困难 。 通 常 必须 由 数据 库 管 理 员 进行 数据 库 结构 的 修改 ， 数 据 库 管 理 员 还 
必须 相应 修改 访问 这 些 结构 的 程序 。 即 使 利用 现在 的 技术 ， 这 种 变更 仍然 是 一 种 很 
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使 他 们 想 并 且 也 有 能 力 改 变 他 人 科 的 业务 方式 以 满足 某 些 新 的 需求 ， 他 们 也 不 会 这 样 
做 ， 因 为 他 们 无 法 承受 更 改 其 信息 系统 所 要 付出 的 时 间 和 费用 (Taylor，1992 )。 为 
了 满足 不 断 提高 的 灵活 性 的 要 求 ， 我 们 需要 一 个 能 够 支持 模式 自然 演化 的 系统 。 
RDBMS 用 于 基于 内 容 的 关联 式 访问 (也 就 是 根据 一 个 或 多 个 谓词 选择 的 说 明 性 语 
句 )， 而 对 导航 式 访问 ( 即 基于 在 单个 记录 之 间 移 动 的 访问 ) 则 显得 无 能 为 力 。 对 于 
在 前 一 节 讨 论 过 的 许多 复杂 应 用 来 说 ， 导 航 式 访问 却 很 重要 。 

这 三 个 问题 中 的 前 两 个 问题 在 许多 DBMS 中 都 存在 ， 不 仅仅 是 针对 关系 系统 。 实 际 上 ， 
关系 模型 本 身 并 不 存在 阻碍 实现 这 些 机 制 的 根本 性 问题 。 

最 近 的 几 个 SQL 标准 ， 即 SQL:2003、SQL:2006、SQL:2008 和 SQL:2011， 通 过 引入 许 
多 新 的 特性 解决 了 上 述 的 一 些 不 足 之 处 。 例 如 ， 作 为 数据 定义 语言 的 一 部 分 ， 人 允许 定义 新 的 
数据 类 型 和 新 的 运算 ， 还 加 入 了 新 的 结构 ， 使 得 SQL 语言 在 计算 上 已 是 完备 的 。 我 们 将 在 
9.5 节 讨 论 SQL:2011。 
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面 问 对 象 的 编程 语言 (如 C++ 或 Java) 获得 持久 性 的 一 种 方法 就 是 将 RDBMS 作为 底层 
的 存储 引擎 。 因 此 就 要 求 将 类 的 实例 ( 即 对 象 ) 映射 到 一 个 或 多 个 元 组 上 ， 这 些 元 组 又 分 布 
在 一 个 或 多 个 关系 中 。 本 节 将 讨论 这 么 做 会 出 现 的 问题 。 为 了 便于 讨论 ， 考 虑 图 9-2 所 示 的 
继承 层次 ， 图 中 有 一 个 超 类 Staff 和 三 个 子 类 Manager、SalesPersonnel 和 Secretary。 









staffNo {PK} 

name 
fName 
IName 

position 

















bonus 
mgrStartDate 


SalesPersonnel 
salesArea 
carAllowance 


图 9-2 Staff 的 继承 层次 示例 


typingSpeed 
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为 了 处 理 这 种 形式 的 类 层次 ,我 们 有 两 个 基本 任务 : 

o 设计 用 于 表示 类 层次 的 关系 。 

o 设计 对 象 的 访问 方式 ， 即 : 
n 编写 代码 将 对 象 分 解 成 元 组 ， 并 且 将 分 解 后 的 对 象 存储 到 关系 中 。 
a 编写 代码 从 关系 中 抽取 元 组 ， 并 且 重 构 对 象 。 

接 下 来 我 们 将 详细 讨论 这 两 个 任务 。 


9.3.1 将 类 映射 为 关系 


有 多 种 策略 可 以 将 类 映射 为 关系 ,尽管 每 一 种 策略 的 转换 结果 都 会 导致 语义 信息 的 丢 
失 。 将 对 和 象 持久 化 以 及 从 数据 库 中 读 取 对 象 的 代码 实现 均 依赖 于 所 选择 的 策略 。 考 虑 下 面 三 
种 可 选 策 略 : 

(1) 将 每 一 个 类 或 子 类 映射 为 一 个 关系 。 

(2) 将 每 一 个 子 类 映射 为 一 个 关系 。 

(3 ) 将 整个 层次 映射 为 一 个 关系 。 
将 每 一 个 类 或 子 类 映射 为 一 个 关系 

一 种 方法 是 将 每 一 个 类 或 子 类 都 映射 为 一 个 关系 。 对 于 图 9-2 给 出 的 类 层次 ,将 产生 下 
列 四 个 关系 ( 主 关键 字 用 下 划 线 标 出 ): 


Staff (staffNo, fName, IName, position, sex, DOB, salary) 

Manager (staffNo, bonus, mgrStartDate) 

SalesPersonnel (staffNo, salesArea, carAllowance) 

Secretary (staffNo, typingSpeed) 

假设 每 个 属性 的 数据 类 型 都 是 RDBMS 所 支持 的 ， 尽管 也 可 能 有 例外 的 情况 一 一 如 果 出 
现 了 RDBMS 不 文 持 的 数据 类 型 ， 则 需要 编写 代码 将 一 种 数据 类 型 转换 为 男 一 种 数据 类 型 。 

然而 ， 在 这 种 关系 模式 中 我 们 丢失 了 语义 信息 : 哪个 关系 表示 超 类 、 哪 个 关系 表示 子 类 
已 经 不 再 明确 。 因 此 我 们 不 得 不 在 每 个 应 用 程序 中 建立 这 些 信息 ， 正 如 前 面 已 经 提 到 的 ， 这 
样 会 导致 代码 重复 ， 也 会 产生 潜在 的 不 一 致 。 
将 每 一 个 子 类 映射 为 一 个 关系 

第 二 种 方法 是 将 每 一 个 子 类 映射 为 一 个 关系 。 对 于 图 9-2 的 层次 应 用 该 种 方法 ， 则 会 产 
生 下 列 三 个 关系 : 

Manager (staffNo, fName, IName, position, sex, DOB, salary, bonus, mgrStartDate) 


SalesPersonnel (staffNo, fName, IName, position, sex, DOB, salary, salesArea, carAllowance) 
Secretary (staffNo, fName, IName, position, sex, DOB, salary, typingSpeed) 


同样 ， 在 这 种 方案 中 我 们 也 丢失 了 语义 信息 : 这 些 关 系 表 示 的 是 否 都 是 同一 个 父 类 的 子 
类 ， 这 一 信息 已 不 再 明确 。 在 这 种 情况 下 ， 为 了 找 出 所 有 的 员工 ， 不 得 不 从 每 个 关系 中 选择 
元 组 ， 然 后 将 结果 合并 。 
将 整个 层次 映射 为 一 个 关系 

第 三 种 方法 是 将 整个 继承 层次 映射 为 一 个 关系 ， 如 下 所 示 : 


Staff (staffNo, fName, IName, position, sex, DOB, salary, bonus, mgrStartDate, salesArea, 
carAllowance, typingSpeed, typeFlag) 


属性 typeFlag 作为 鉴别 器 可 以 区 分 每 个 元 组 的 类 型 (例如 ， 如 果 元 组 是 一 个 Manager 
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元 组 ， 则 typeFlag 的 值 为 1 ; 如 果 是 SalesPersonnel 元 组 ， 则 typeFlag 的 值 为 2; 如 果 是 
Secretary 元 组 ， 则 typeFlag 的 值 为 3 )。 同 样 ， 在 这 个 映射 中 也 丢失 了 语义 信息 。 并 且 这 种 
映射 对 那些 不 适用 于 某 些 元 组 的 属性 会 产生 一 些 不 必要 的 空 值 。 例 如 ， 对 于 Manager 元 组 ， 
属性 salesArea, carAllowance 和 typingSpeed 都 是 空 。 


9.3.2 访问 关系 数据 库 中 的 对 象 


关系 数据 库 结 构 的 设计 工作 完成 以 后 ， 接 下 来 要 将 对 象 插入 数据 库 中 ， 然 后 提供 读 取 、 
更 新 和 删除 对 象 的 机 制 。 例 如 ， 为 了 将 一 个 对 象 插入 上 节 的 第 一 种 关系 模式 中 ( 即 为 每 一 个 
类 创建 一 个 关系 )， 用 可 程序 式 SQL (参见 附录 1) 编写 代码 如 下 : 


Manager* pManager = new Manager; // 创建 一 个 新 的 Manager 对 象 
.… 此 处 为 创建 Manager 对 象 的 代码 ... 
EXEC SQL INSERT INTO Staff VALUES (:pManager->staffNo, :pManager-> 
fName, 
:pManager->IName, :pManager-> position, :p Manager->sex, :pManager->DOB, 
:pManager-> salary); 
EXEC SQL INSERT INTO Manager VALUES (:pManager->bonus, 
:p Manager->mgrStartDate); 


男 一 方面 ， 如 果 Manager 已 经 被 声明 成 持久 类 ， 则 下 面 的 (指示 性 的 ) 语句 可 以 使 对 象 
在 OODBMS 中 成 为 持久 的 : 


Manager* pManager = new Manager; 


在 27.3.3 节 ， 我 们 将 研究 声明 持久 类 的 各 种 方法 。 如 果 现 在 希望 从 关系 数据 库 中 检索 某 
些 数据 ， 假 设 需 要 检索 奖金 超过 1000 英镑 的 经 理 的 信息 ， 则 代码 可 能 为 : 


Manager* pManager = new Manager; // 创建 一 个 新 的 Manager 对 象 
EXEC SQL WHENEVER NOT FOUND GOTO done; // 对 错误 的 处 理 
EXEC SQL DECLARE managerCursor // 为 SELECT 语句 创建 游标 
CURSOR FOR 
SELECT staffNo, fName, IName, salary, bonus 
FROM Staff s, Manager m // 需要 连接 Staff 和 Manager 


WHERE s.staffNo = m.staffNo AND bonus > 1000; 

EXEC SOL OPEN managerCursor; 

for(;;){ 
EXEC SQL FETCH managerCursor // 取出 结果 中 的 下 一 条 记录 
INTO :staffNo, :fIName, :IName, :salary, :bonus; 
pManager->staffNo = :staffNo; // 将 数据 传递 给 对 象 Manager 
pManager->fName = :fName; 
pManager->IName = :IName; 
pManager->salary = :salary; 
pManager->bonus = :bonus; 
strcpy(pManager-> position, “ Manager”); 

i 

EXEC SQL CLOSE managerCursor; /结束 前 关闭 游标 


Fi—TFi til, KA OODBMS 中 获得 同样 的 一 组 数据 ， 可 以 用 下 面 的 代码 : 


os_Set<Manager*> &highBonus 
= managerExtent->query(“Manager*”, “bonus > 1000”, db1); 


该 语句 在 类 Manager ( managerExtent) 的 范围 内 搜索 ， 从 数据 库 (APIA dbl) 中 寻找 
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所 需 (bonus>1000 ) 的 实例 。 商 品 化 OODBMS ObjectStore 含有 一 组 模板 类 os Set, FEA 
例 中 被 实例 化 为 包含 了 一 组 指向 Manager 对 象 的 指针 <Manager*>。 在 28.3 节 中 ， 我 们 将 继 
续 讨 论 ObjectStore 中 对 象 持 久 性 和 对 象 检 索 的 有 关内 容 。 

上 面 的 示例 说 明了 将 面向 对 象 的 语言 映射 到 关系 数据 库 时 的 复杂 性 。 在 第 27 和 28 章 中 
我 们 要 讨论 的 OODBMS 的 方法 ， 则 试图 将 程序 设计 语言 的 数据 模型 与 数据 库 的 数据 模型 进 
行 更 加 无 颖 的 集成 ， 从 而 不 再 需要 如 前 所 述 的 复杂 转换 ， 这 种 转换 可 能 要 占用 多 达 30% 的 
编程 工作 量 。 
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关系 DBMS 是 当前 占据 市 场 主导 地 位 的 数据 库 技术 ，2011 年 全 世界 的 软件 销售 额 约 
为 240 亿美 元 ，2016 年 将 达到 370 亿美 元 。 直 到 最 近 ，DBMS 的 发 展 方向 仍然 徘徊 在 关系 
DBMS 和 OODBMS 之 间 。 但 是 ， 许 多 RDBMS 的 供应 商 已 经 意识 到 了 OODBMS 的 威胁 ， 
看 到 了 OODBMS 的 前 景 。 他 们 认同 了 传统 的 关系 DBMS 已 不 再 适用 于 9.1 节 讨 论 的 高 级 应 
用 ,需要 增加 这 些 应 用 所 需 的 功能 。 可 是 ,他 们 驳斥 了 那 种 认为 扩展 的 RDBMS 不 能 提供 足 
够 的 功能 或 者 因为 太 慢 而 不 足以 应 对 新 的 复杂 性 的 观点 。 

如 果 对 不 断 涌现 的 高 级 数据 库 应 用 进行 考察 ， 就 会 发 现 它们 广泛 地 应 用 了 许多 面向 对 
象 的 特征 ， 例 如 : 用 户 可 扩展 的 类 型 系统 、 封 装 、 继 承 、 多 态 性 、 方 法 的 动态 绑 定 、 包 括 了 
非 第 一 范式 的 对 象 的 复杂 对 象 以 及 对 象 标 识 。 弥 补 关 系 模 型 缺陷 的 最 显而易见 的 方法 就 是 扩 
展 模型 ， 使 其 具备 这 些 特征 。 尽 管 实 现 的 特征 各 有 不 同 ， 但 许多 扩展 的 关系 DBMS 所 采用 
的 就 是 这 种 方法 。 因 而 ， 不 存在 唯一 的 扩展 的 关系 模型 ; 更 恰当 地 说 ， 存 在 多 种 扩展 的 关系 
模型 ， 其 特性 取决 于 扩展 的 方法 和 程度 。 然 而 ， 所 有 模型 都 使 用 相同 的 基本 关系 表 和 查询 语 
言 ， 所 有 模型 都 引入 了 “对 象 ” 的 某 些 概念 ， 有 的 还 可 以 像 存储 数据 一 样 将 方法 (或 者 过 程 、 
fk Aas) 存储 在 数据 库 中 。 

人 们 曾 使 用 各 种 不 同 的 术语 来 称呼 支持 了 扩展 的 关系 数据 模型 的 系统 。 最 早 的 术语 是 
扩展 的 关系 数据 库 管 理 系 统 ( Extended Relational DBMS ，ERDBMS)， 还 使 用 过 术语 通用 服 
务 器 (Universal Server) 和 通用 数据 库 管 理 系统 (Universal DBMS，UDBMS )。 近 年 来 ， 为 
了 更 好 地 说 明 系 统 引 入 的 一 些 “ 对 象 ” 的 概念 ， 更 多 地 使 用 了 术语 对 象 - 关 系数 据 库 管理 
系统 ( Object-Relational DBMS)。 本 章 使 用 ORDBMS 这 一 术语 。 三 家 主要 的 关系 DBMS 的 
供应 商 一 一 Oracle、Microsoft 和 IBM 一 一 都 已 将 其 系统 扩展 为 ORDBMS， 只 是 功能 上 略 有 
不 同 罢了 。ORDBMS 作为 RDBMS 和 OODBMS 相 混 合 的 概念 是 极 具 吸引 力 的 ， 它 保留 了 
RDBMS 已 有 的 大 量 知识 和 经 验 。 因 此 ， 一 些 分 析 家 预测 ORDBMS 将 比 RDBMS 的 市 场 占 
有 率 多 出 50 个 百分点 。 

正如 预期 的 那样 ， 这 一 领域 的 标准 的 制定 是 对 SQL 标准 的 扩展 。 国 际 标准 化 组 织 
1991 年 起 一 直 在 进行 SQL 语言 的 对 象 扩 展 工作 。 这 些 扩展 已 经 成 为 SQL 标准 的 组 成 部 分 ， 
即 1999 年 发 布 的 SQL:1999 和 2003 年 发 布 的 SQL:2003， 以 及 2006 年 发 布 的 进一步 扩展 为 
支持 XML 的 SQL:2006 和 随后 的 2008 ( SQL:2008 ), 2011 ( SQL:2011 )。 这 些 SQL 标准 版 
本 正在 尝试 将 关系 模型 和 查询 语言 的 扩展 标准 化 。 本 章 将 详细 讨论 SQL WMAP IE. AB 
用 SQL:2011 统一 指 代 1999 年 、2003 年 、2006 年 、2008 年 和 2011 年 发 布 的 各 个 标准 版 本 。 
Stonebraker 的 观点 

Stonebraker (1996) 提出 了 一 种 数据 库 的 四 象限 观点 ， 如 图 9-3 所 示 。 左 下 角 的 象限 是 
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那些 处 理 简 单数 据 且 没有 数据 查询 需求 的 应 用 。 这 类 应 用 ， 比 如 包括 了 Word, WordPerfect 
和 Framemaker 等 的 标准 文本 处 理 程 序 包 ， 可 以 使 用 底层 的 操作 系统 来 获得 必要 的 DBMS 的 
持久 性 功能 。 右 下 角 的 象限 是 那些 处 理 复杂 数据 但 对 数据 查询 仍然 没有 很 大 需求 的 应 用 。 对 
于 这 类 应 用 ， 如 计算 机 辅助 设计 程序 包 ，OODBMS 可 能 是 一 个 不 错 的 DBMS 选择 。 左 上 角 
的 象限 是 那些 处 理 简 单数 据 但 有 复杂 的 查询 需求 的 应 用 。 很 多 传统 的 商业 应 用 都 落 在 这 个 象 
限 里 ， 对 于 这 些 应 用 ，RDBMS 是 最 适当 不 过 的 DBMS 选择 。 最 后 ， 在 上 角 的 象限 是 那些 既 
处 理 复杂 数据 又 有 复杂 的 查询 需求 的 应 用 。 这 一 象限 包含 了 9.1 节 讨 论 过 的 许多 高 级 数据 库 
应 用 ， 对 这 些 应 用 来 说 ，ORDBMS 可 能 是 最 合适 的 DBMS 选择 。 


关系 DBMS 对 象 关 系 DBMS 





数据 复杂 性 /可 扩展 性 
图 9-3 ”数据库 世界 四 分 观点 


这 种 划分 很 有 意思 , 但 这 只 是 一 个 非常 简单 的 分 类 方法 ， 其 实 许多 数据 库 应 用 都 不 是 那 
么 容易 分 类 的 。 而 且 ， 正 如 28.2 节 讨 论 的 那样 ， 随 着 ODMG 数据 模型 和 查询 语言 的 引入 ， 
以 及 SQL 中 面 回 对 象 数据 管理 特征 的 增加 ，OODBMS 和 ORDBMS 之 间 的 区 别 变 得 越 来 越 
不 明显 。 

ORDBMS 的 优点 

除了 能 够 克服 9.2 节 提 到 的 许多 缺点 以 外 ， 扩 展 的 关系 数据 模型 的 主要 优点 在 于 重用 
(reuse) 和 共享 ( sharing)。 重 用 (HIP JE DBMS 服务 器 ) 能 够 集中 实现 标准 的 功能 ， 而 不 是 
在 每 个 应 用 中 都 重新 编写 实现 这 些 功能 的 代码 。 例 如 ， 某 个 应 用 可 能 需要 表示 点 、 线 、 多 边 
形 的 空间 数据 类 型 ， 而 且 需 要 计算 两 点 之 间 的 距离 、 点 线 之 间 的 距离 以 及 对 点 是 否 被 多 边 形 
包含 、 两 个 多 边 形 区 域 是 否 重 琶 等 情况 进行 判断 的 函数 。 如 果 可 以 将 这 些 功 能 租 入 服务 器 
中 ， 就 不 用 在 每 个 需要 它 的 应 用 程序 中 都 重新 定义 ， 而 且 这 些 功能 也 可 以 被 所 有 的 应 用 程序 
共享 。 同 时 ， 这 些 优 点 也 提高 了 开发 者 和 终端 用 户 的 工作 效率 。 

-另外 一 个 显著 的 优点 是 ， 扩 展 关 系 方法 保留 了 那些 在 开发 关系 应 用 的 过 程 中 积 
的 宝贵 知识 和 经 验 。 这 是 一 个 非常 重要 的 优点 ， 因 为 多 数组 织 机 构 会 发 现 ， 彻 底 更 换 
DBMS 的 成 本 是 难以 承受 的 。 如 果 新 的 功能 设计 得 当 ， 这 种 方法 可 以 允许 组 织 机 构 以 进 
化 的 方式 利用 新 的 扩展 而 不 致 于 丢失 当前 数据 库 特 征 和 功能 带 来 的 好 处 。 因 而 ， 可 以 作 
为 概念 验证 项 目 ( proof-of-concept project) 采用 集成 的 方式 引入 ORDBMS, SQL:2011 
标准 的 设计 向 上 兼容 SQL2 标准 ， 因 此 ， 任 何 与 SQL:2011 兼容 的 ORDBMS 也 都 能 够 兼 
容 SQL2 标准 。 
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ORDBMS 的 缺点 


ORDBMS 最 明显 的 缺点 就 是 其 复杂 性 以 及 由 此 引起 的 成 本 的 增加 。 此 外 ， 有 些 关系 方 
法 的 支持 者 坚信 ， 这 些 扩展 将 导致 关系 模型 的 简洁 性 的 丧失 。 也 有 人 认为 ， 对 关系 DBMS 
进行 扩展 只 是 为 了 那些 很 少见 的 应 用 ， 它 们 利用 当前 的 关系 DBMS 无 法 获得 最 优 性 能 。 

另 一 方面 ， 面 向 对 象 的 纯粹 化 论 者 也 不 欣赏 这 些 扩展 。 他 们 认为 对 象 -关系 系统 的 术语 
有 些 标新立异 。 因 为 它们 没有 讨论 对 象 模 型 ， 反 而 使 用 像 “用 户 定 义 的 数据 类 型 ”这 样 的 术 
语 。 而 面向 对 象 的 术语 却 都 是 与 “抽象 类 型 ”“ 类 层次 ”和 “对 象 模型 ”密切 相关 的 。 但 是 
ORDBMS 的 供应 商 还 是 将 对 象 模型 描述 为 增加 了 某 些 复杂 性 后 的 关系 模型 扩展 。 这 样 就 可 
能 避 开 面向 对 象 这 一 基本 点 ， 突 出 这 两 种 技术 之 间 在 语义 上 的 巨大 差异 。 对 象 应 用 不 像 关 系 
应 用 那样 仅 以 数据 为 中 心 ， 面 向 对 象 的 模型 和 程序 结合 得 更 加 紧密 ， 封 装 的 对 象 能 够 更 加 真 
实地 反映 出 “现实 世界 ”。 这 样 就 可 以 描述 比 SQL 所 能 表示 的 更 广泛 的 实体 联系 的 集合 ， 并 
且 对 象 定义 中 还 包含 了 功能 性 的 程序 。 事 实 上 ， 从 根本 上 说 对 象 并 不 是 数据 的 扩展 ， 而 是 一 
个 截然 不 同 的 概念 ， 能 更 好 地 表现 “现实 世界 ”的 联系 和 行为 。 

第 6 章 我 们 曾 强 调 过 ， 数 据 库 语言 的 目标 就 是 让 用 户 只 需 较 少 的 付出 就 可 以 使 用 ， 同 时 
具有 相对 易学 的 命令 结构 与 语法 。1989 年 颁布 的 最 初 的 SQL 标准 看 似 已 经 达到 了 这 个 目标 。 
而 1992 年 颁布 的 标准 从 120 页 增加 到 将 近 600 页 ， 这 让 人 怀疑 它 是 否 满足 这 些 日 标 。 遗 憾 
的 是 ，SQL:2011 标准 的 页 数 更 加 令 人 泪 丧 ， 看 起 来 它 似 乎 没有 满足 上 述 目 标 ， 更 有 其 者 开 
始 怀疑 标准 的 制定 者 究竟 有 没有 考虑 过 要 满足 这 些 目标 。 


9.5 SQL:2011 


在 第 6 ASS 7 章 中 ， 我 们 针对 ISO SQL 标准 进行 了 广泛 的 讨论 ， 讨 论 内 容 主要 集中 
在 1992 年 版 的 标准 所 描述 的 一 些 特征 ， 即 通常 所 说 的 SQL2 或 SQL-92。ANSI (X3H2 ) 和 
ISO (ISO/IEC JTC1/SC21/WG3 ) 的 SQL 标准 已 经 在 SQL 规范 中 添加 了 支持 面向 对 象 数据 
管理 的 特征 ， 最 近 发 布 的 版 本 为 SQL:2011 (ISO, 2011a)。 正 如 前 面 提 到 的 ，SQL:2011 标准 
非常 庞大 和 复杂 ， 可 以 分 为 以 下 部 分 : 

(1) ISO/IEC 9075-1: SQL/Framework. 

(2) ISO/IEC 9075-2 : SQL/Foundation。 包 插 新 的 数据 类 型 、 用 户 自 定义 类 型 、 规 则 和 
触发 器 、 事 务 存储 例 程 和 绑 定 的 方法 Gk Ast SQL, WA SQL 和 SQL 的 直接 调用 )。 

(3 ) ISO/IEC 9075-3 : SQL/CLI ( Call-Level Interface， 调 用 级 接口 )。 定 义 了 数据 库 的 
API 接口 ， 正 如 附录 E 中 所 讨论 的 那样 ， 基 于 SQL Office 访问 组 和 X/Open 的 CLI 的 定义 。 

(4) ISO/IEC 9075-4 : SQL/PSM ( Persistent Stored Module, 持久 存 储 模块 )。 人 允许 用 
3GL 或 者 SQL 声明 过 程 和 用 户 自 定义 函数 ,并 且 存 储 在 数据 库 中 ,使 得 SQL 计算 完备 。 

(5) ISO/IEC 9075-9: SQL/MED (Management of External Data， 外 部 数据 管理 )。 定 义 
SQL 扩展 用 以 文 持 管理 外 部 数据 ， 对 外 部 数据 管理 的 支持 是 通过 使 用 外 部 表 和 datalink 数据 
类 型 实现 的 。 

(6) ISO/IEC 9075-10 : SQL/OLB (Object Language Bindings， 对 象 语言 绑 定 )。 和 定义 了 
将 SQL iB AHA Java 程序 的 机 制 。 

(7) ISO/IEC 9075-11 : SQL/Schemata ( Information and Definition Schemas, {F BANE 
义 模式 )。 定 义 了 两 个 模式 一 一 INFORMATION SCHEMA fil DEFINITION SCHEMA. fa 
息 模 式 定义 了 与 数据 库 对 象 (如 表 、 视 图 和 列 ) 有 关 的 视图 。 这 些 视图 是 根据 定义 模式 中 基 
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本 表 定 义 的 。 

( 8) ISO/IEC 9075-13 : SQL/JRT ( Java Routines and Types Using the Java Programming 
Language， 使 用 Java 语言 的 Java 例 程 和 类 型 )。 定 义 了 SQL 对 Java 的 扩展 ， 人 允许 将 用 Java Ë 
写 的 静态 方法 当 作 SQL 调用 例 程 来 调用 ， 也 人 允许 将 Java 定义 的 类 当 作 SQL 的 结构 类 型 使 用 。 

(9) ISO/IEC 9075-14: SQL/XML (XML-Related Specifcations, XML 相关 的 规范 )。 定 
义 了 SQL 对 XML 的 扩展 ， 人 允许 创建 和 操作 XML 文档 。 

本 他 将 讨论 其 中 部 分 特征 ， 包 括 : 

© 行 类 型 和 引用 类 型 的 类 型 构造 前 。 

e 可 以 参与 超 类 型 / 子 类 型 联系 的 用 户 自 定义 类 型 ( 单 值 类 型 ( distinct type) 和 结构 类 
#4 (structured type) )。 

用 户 自 定义 过 程 、 图 数 、 方 法 和 操作 符 。 
集 类 型 (ARRAY, SET, LIST, MULTISET) 的 类 型 构造 器 。 
对 大 对 象 的 支持 一 一 二 进 制 大 对 象 (BLOB) 和 字符 大 对 象 (CLOB). 

e 递归 。 

附录 K 讨论 的 许多 面向 对 象 的 概念 都 在 考虑 之 列 。SQL:1999 标准 的 最 后 版 本 远 远 落后 
于 预定 计划 ， 对 象 管理 的 某 些 特性 被 推迟 到 标准 的 下 一 版 发 布 ， 但 许多 特性 在 SQL:2011 中 
仍 未 出 现 。 


95.1 行 类 型 


行 类 型 是 一 个 字段 名 /数据 类 型 对 的 序列 ， 它 提供 了 表示 表 中 行 的 数据 类 型 。 这 样 一 
来 ， 既 可 以 将 一 个 完整 的 行 存 储 在 变量 中 ， 也 可 以 作为 参数 传递 给 例 程 ， 还 可 以 作为 函数 调 
用 的 返回 值 返回 。 行 类 型 还 可 以 用 于 让 表 的 某 列 包含 行 值 。 本 质 上 ， 行 是 内 套 在 表 中 的 表 。 


| 例 9.1 信行 类 型 的 用 法 
为 了 说 明 行 类 型 的 用 法 ， 我 们 创建 了 一 个 只 包含 部 门 编号 和 地 址 的 简单 的 Branch 表 ， 
并 在 新 表 中 插入 一 条 记录 : 


CREATE TABLE Branch ( 


branchNo CHAR(4), 
address ROW (street VARCHAR(25), 
city VARCHAR(15), 
postcode ROW cityidentifier VARCHAR (4), 


subPart VARCHAR(4)))); 
INSERT INTO Branch 
VALUES (‘B005’, ROW(‘23 Deer Rd’, ‘London’, ROW(‘SWI’, ‘4EH’))); 
UPDATE Branch 
SET address = ROW (‘23 Deer Rd’, ‘London’, ROW (‘SW1’, ‘4EH’)) 
WHERE address = ROW (‘23 Deer Rd’, ‘London’, ROW (‘SW1’, ‘4EH’)); «K 


9.5.2 用户 自 定义 类 型 


SQL:2011 允许 定义 用 户 自 定义 类 型 ( User-Defined Type，UDT)， 前 面 称 之 为 抽象 数据 类 
型 (Abstract Data Type, ADT). UDT 的 使 用 方法 与 预定 义 类 型 (如 CHAR.、INT、FLOAT) 相同 。 
UDT 被 分 为 两 类 : 特有 (distinct) 类 型 和 结构 (structured) 类 型 ， 其 中 特有 类 型 较为 简单 ， 它 
能 使 具有 相同 的 基 类 型 的 类 型 有 所 区 别 。 例 如 ， 我 们 可 以 创建 两 个 特有 类 型 : 
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CREATE TYPE OwnerNumberType AS VARCHAR(5) FINAL; 

CREATE TYPE StaffNumberType AS VARCHAR(5) FINAL; 

如 果 我 们 试图 把 其 中 一 个 类 型 的 实例 作为 男 一 个 类 型 的 实例 对 待 ， 就 会 产生 错误 。 注 
意 ， 尽 管 SQL 也 人 允许 创建 域 以 区 分 不 同 的 数据 类 型 ， 但 SQL 域 的 目的 仅仅 是 约束 可 以 存储 
在 某 一 列 内 的 有 效 值 的 集合 。 

对 于 更 一 般 的 情况 ，UDT 定义 包括 了 一 个 或 多 个 属性 定义 、 零 个 或 多 个 例 程 声明 ( 方 
法 )， 以 及 随后 的 操作 符 声 明 。 例 程 和 操作 符 一 般 都 称 为 例 程 。 此 外 ， 还 可 以 用 CREATE 
ORDERING FOR 语句 为 UDT 定义 相等 和 顺序 关系 。 

可 以 用 点 符号 C.) 访问 属性 值 。 例 如 ， 假 定 p 是 UDT 类 型 PersonType 的 一 个 实例 ， 其 
中 包含 一 个 类 型 为 VARCHAR 的 属性 fName， 可 以 用 如 下 方法 访问 fName 属性 : 

p.fName 


p.fName = ‘A. Smith’ 


封闭、 观察 绒 函 数 和 变换 堪 困 数 

SQL 封 狼 所 有 结构 类 型 的 属性 ， 做 法 是 为 每 个 属性 定义 一 对 预定 义 例 程 : 观察 器 
(observer) PAY (相当 于 get KAO 和 变换 器 (mutator) 函数 (相当 于 set 函数 )。 当 用 户 访问 
属性 时 ， 可 以 调用 这 两 个 例 程 。 观 察 右 函数 返回 属性 的 当前 值 ， 变 换 器 函数 按照 给 定 的 参数 
值 来 设置 属性 的 值 。 用 户 可 以 在 UDT 的 定义 里 重新 定义 这 两 个 函数 。 通 过 这 种 方法 ， 属 性 
值 被 封装 起 来 ， 用 户 只 能 通过 调用 这 两 个 函数 实现 对 属性 值 的 访问 。 例 如 ，PersonType 的 属 
性 fName AY MLAS ak PAA : 


FUNCTION fName(p PersonType) RETURNS VARCHAR(15) 
RETURN p.fName; 


设置 newValue {HAY FHI PR AE PARA : 


FUNCTION fName(p PersonType RESULT, newValue VARCHAR(15)) 
RETURNS PersonType 
BEGIN 
p.fName = newValue; 
RETURN p; 
END; 


KIE a PABA NEW 表达 式 


一 个 (公共 的 ) 构造 器 函数 是 为 创建 类 型 的 新 实例 而 自动 定义 的 。 构 造 器 孙 数 和 UDT 
具有 相同 的 名 字 和 类 型 ， 没 有 参数 ， 返 回 该 类 型 的 且 属 性 值 被 置 为 默认 值 的 一 个 新 实例 。 用 
户 可 以 提供 自 定义 的 构造 器 方法 对 某 结构 类 型 新 创建 的 实例 进行 初始 化 。 所 有 的 构造 方法 必 
须 和 结构 类 型 同名 ， 但 其 参数 必须 和 系统 提供 的 构造 器 的 参数 不 同 。 而 且 ， 每 一 个 用 户 自 定 
义 的 构造 需 方 法 必须 在 参数 的 个 数 或 者 参数 的 类 型 上 有 所 不 同 。 例 如 ， 我 们 可 以 用 如 下 方法 
初始 化 类 型 PersonType 的 构造 器 : 

CREATE CONSTRUCTOR METHOD PersonType ((N VARCHAR(15), 

IN VARCHAR(15), sx CHAR) RETURNS PersonType SELF AS RESULT 
BEGIN 
SET SELF.fName = fN; 
SET SELF.IName = IN; 
SET SELF.sex = sx; 


RETURN SELF; 
END; 
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可 以 用 NEW 表达 式 调用 系统 提供 的 构造 器 方法 ， 例 如 : 

SET p = NEW PersonType(); 

用 户 目 定义 的 构造 名 方法 被 调用 的 上 下 文 与 NEW 表达 式 等 同 。 例 如 ， 我 们 可 以 调用 上 
面 的 用 户 目 定义 的 构造 方法 创建 PersonType 的 一 个 实例 : 

SET p = NEW PersonType(‘John’, ，White ‘M’); 

这 将 被 有 效 地 翻译 为 : 


SET p = PersonType().PersonType(‘John’, ‘White’, “M’); 


其 他 UDT 方法 
可 约束 UDT 实例 按 指定 的 顺序 排列 。EQUALS ONLY BY 和 ORDER FULL BY 子 句 可 
用 来 说 明 比 较 UDT 实例 的 函数 。 下 列 方法 均 可 用 于 排序 : 
è RELATIVE。 该 方法 是 一 个 相等 时 返回 零 、 小 于 时 返回 负数 、 大 于 时 返回 正 数 的 
函数 。 
© MAP。 该 方法 使 用 的 函数 带 有 一 个 UDT 类 型 的 参数 ， 并 返回 一 个 预定 义 数据 类 型 
值 。UDT 类 型 的 两 个 实例 的 比较 是 通过 对 应 的 函数 值 的 比较 实现 的 。 
© STATE。 该 方法 通过 比较 操作 数 的 属性 来 决定 顺序 。 
还 可 以 定义 CAST 函数 ， 用 户 自 定义 不 同 UDT 之 间 的 转换 函数 。 在 后 续 版 本 的 标准 
中 ， 也 可 能 允许 覆 写 某 些 预定 义 的 操作 符 。 
| 例 9.2 >> 定义 新 的 UDT 
为 了 解释 创建 一 个 新 的 UDT 的 方法 ， 这 里 ， 我 们 为 PersonType 创建 一 个 UDT: 


CREATE TYPE PersonType AS ( 
dateOfBirth DATE, 


fName VARCHAR(15), 
IName VARCHAR(15), 
sex CHAR) 

INSTANTIABLE 

NOT FINAL 

REF IS SYSTEM GENERATED 


INSTANCE METHOD age () RETURNS INTEGER, 
INSTANCE METHOD age (DOB DATE) RETURNS PersonType; 
CREATE INSTANCE METHOD age () RETURNS INTEGER 
FOR PersonType 
BEGIN 
RETURN /* age calculated from SELF.dateOfBirth */; 
END; 
CREATE INSTANCE METHOD age (DOB DATE) RETURNS PersonType 
FOR PersonType 
BEGIN 
SELF.dateOfBirth = /* code to set dateOfBirth from DOB*/; 
RETURN SELF; 
END; 


这 一 示例 也 给 出 了 存储 属性 和 虚拟 属性 的 用 法 。 存 储 属 性 ( stored attribute) 为 默认 形 
式 ， 它 有 一 个 属性 名 和 数据 类 型 。 数 据 类 型 可 以 是 任何 已 知 的 数据 类 型 ， 包 括 其 他 的 
UDT。 相 反 ， 虚 拟 属 性 (virtual attribute) 并 不 与 被 存储 数据 相对 应 ， 而 是 对 应 着 导出 数 
据 。 这 里 有 一 个 隐 式 的 虚拟 属性 age， 它 是 由 (观察 器 ) age 函数 导出 并 使 用 (变换 大 ) age 
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函数 赋值 的 S。 从 用 户 的 观点 来 看 ， 存 储 属性 和 虚拟 属性 之 间 没 有 显著 的 区 别 ， 都 是 使 用 相 
应 的 观察 器 和 变换 器 函数 来 访问 的 。 只 有 UDT 的 设计 者 知道 其 中 的 不 同 。 

关键 字 INSTANTIABLE 指明 该 类 型 可 以 创建 实例 。 如 果 声 明了 NOT INSTANTIABLE， 
就 表示 不 能 创建 该 类 型 的 实例 ， 而 只 能 使 用 其 子 类 型 。 关 键 字 NOT FINAL 指明 可 以 创建 用 
户 定义 类 型 的 子 类 型 。 我 们 将 在 9.5.6 节 讨 论 REF IS SYSTEM GENERATED 子 句 。 « 


9.5.3” 子 类 型 和 超 类 型 


SQL:2011 允许 UDT 使 用 UNDER 子 句 参与 子 类 型 / 超 类 型 的 层次 结构 的 定义 。 一 个 类 
型 可 以 拥有 多 个 子 类 型 ， 但 是 目前 子 类 型 只 能 有 一 个 超 类 型 《 即 不 支持 多 重 继承 )。 子 类 型 
继承 超 类 型 所 有 的 属性 和 行为 (方法 )， 可 以 像 其 他 UDT 一 样 定义 自己 的 属性 和 方法 ， 也 可 
以 重 载 继承 来 的 方法 。 


| 例 9.3 >> 使 用 UNDER 子 句 创建 子 类 型 
创建 超 类 型 PersonType 的 子 类 型 StaffType 的 语句 为 : 


CREATE TYPE Stafffype UNDER PersonType AS ( 


staffNo VARCHAR(5), 

position VARCHAR(10) DEFAULT ‘Assistant’, 
salary DECIMAL(7, 2), 

branchNo CHAR(4)) 

INSTANTIABLE 

NOT FINAL 


INSTANCE METHOD isManager () RETURNS BOOLEAN; 
CREATE INSTANCE METHOD isManager() RETURNS BOOLEAN 


FOR StaffType 
BEGIN 
IF SELF.position = ‘Manager THEN 
RETURN TRUE; 
ELSE 
RETURN FALSE; 
END IF 
END) 


StaffType 不 但 拥有 CREATE TYPE 中 定义 的 所 有 属性 ， 也 包含 从 PersonType 中 继 
承 来 的 属性 ， 以 及 相应 的 观察 器 卫 数 、 变 换 右 函数 和 其 他 已 定义 的 函数 。 特 别 是 ，REF 
IS SYSTEM GENERATED 子 句 也 被 有 效 地 继承 了 。 男 外 ;我 们 还 定义 了 一 个 实例 方法 
isManager, 用 来 检查 某 个 员工 是 否 是 经 理 。 我 们 将 在 9.5.8 节 讲 述 该 方法 的 用 法 。 « 


一 个 子 类 型 的 实例 被 认为 也 是 其 所 有 超 类 型 的 实例 .SQL:2011 SAR (substitutability), 
即 在 需要 超 类 型 实例 的 地 方 都 可 以 用 子 类 型 的 实例 蔡 代 。 可 以 用 TYPE 谓词 测试 UDT 的 类 
型 。 例 如 ， 对 于 给 定 的 用 户 自 定义 类 型 Udtl ， 我 们 可 以 这 样 测 试 : 

TYPE Udt1 IS OF (PersonType) // 检查 Udt1 是 否 为 PersonType 类 型 或 PersonType 的 某 个 子 类 型 

TYPE Udt1 IS OF (ONLY PersonType) // 检查 Udt1 是 否 为 PersonType 类 型 

和 大 多 数 程序 设计 语言 一 样 ， 在 SQL:2011 F, A UDT 的 实例 都 必须 与 最 特殊 的 类 
型 关联 ， 即 把 最 低层 的 子 类 型 指派 给 该 实例 。 因 此 ， 如 果 某 个 UDT 具有 多 个 直接 超 类 型 ， 


O ” 注意， 这 里 的 函数 名 age 被 重 载 。 我 们 将 在 9.5.5 节 讨 论 SQL 如 何 区 分 这 两 个 函数 。 
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则 该 实例 必定 属于 其 中 某 一 个 类 型 ， 该 类 型 应 该 是 该 实例 所 属 所 有 其 他 类 型 的 子 类 型 。 有 
些 情况 下 ， 可 能 需要 创建 很 多 类 型 。 例 如 ， 一 个 类 型 层次 中 最 大 的 超 类 型 可 能 是 Person， 
其 子 类 型 有 Student 和 Staff ; Student 又 有 三 个 直接 子 类 型 Undergraduate, Postgraduate 和 
PartTimeStudent， 如 图 9-4a 所 示 。 如 果 一 个 实例 拥有 类 型 Person 和 Student, AX Student 
是 Person 的 子 类 型 ， 所 以 此 时 最 特殊 的 类 型 就 是 Student， 尽 管 它 处 于 非 叶 节点 位 置 。 可 
是 ， 在 这 个 类 型 层次 中 ， 除 非 我 们 创建 类 型 PTStudentStaff， 如 图 9-4b 所 示 ， 否 则 一 个 
实例 就 不 可 能 同时 拥有 类 型 PartTimeStudent 和 staff。 此 时 新 创建 的 叶 节 点 位 置 的 类 型 
PTStudentStaff 就 是 最 特殊 的 类 型 。 类 似 的 ， 有 些 全 日 制 的 本 科 生 和 研究 生 会 做 兼职 (与 在 
职 学 生 全 职员 工 的 身份 相对 )， 所 以 我 们 也 得 增加 子 类 型 FTUGStaff 和 FTPGStaff。 如 果 将 
这 种 方法 泛 化 ， 我 们 就 有 可 能 创建 大 量 的 子 类 型 。 某 些 情况 下 ， 一 种 更 好 的 方法 是 在 表 一 级 
而 不 是 在 类 一 级 使 用 继承 ， 稍 后 讨论 。 





ee a 
S > ya {es 


SE 


构 


` -ow 
^el 
ms 


i a = 


b) 修改 后 的 Student/Staff 层 次 
图 9-4 


权限 

要 创建 一 个 子 类 型 ， 用 户 必 须 在 作为 该 子 类 型 的 超 类 型 的 用 户 自 定义 类 型 上 拥有 
UNDER 权限 。 此 外 ， 用 户 必须 在 该 子 类 型 将 引用 的 用 户 自 定义 类 型 上 拥有 USAGE 权限 。 

在 SQL:1999 之 前 ，SELECT 的 权限 只 能 作用 于 表 和 视图 的 列 。 在 SQL:1999 中 ， 
SELECT 权限 也 可 以 作用 于 结构 类 型 ， 但 前 提 是 该 类 型 的 实例 被 存储 在 类 型 化 的 表 中 ， 同 
时 只 有 当 来 自 REF 值 的 间接 引用 运算 符 ( dereference operator) 作用 于 被 引用 行 时 ， 方 法 才 
可 以 作用 于 被 引用 行 。 对 于 存储 在 普通 SQL 表 的 某 列 中 的 结构 化 值 ， 调 用 某 一 方法 时 ， 则 
需要 拥有 该 列 的 SELECT 权限 。 如 果 要 调用 的 方法 是 一 个 变换 需 图 数 ， 则 还 需要 该 列 的 
UPDATE 权限 。 此 外 ， 对 于 调用 任何 方法 ， 都 需要 用 户 拥 有 EXECUTE 权限 。 
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954 ”用 户 自 定义 例 程 


名 的 重 载 。 


用 户 自 定义 例 程 (User-Defined Routine, UDR) 定义 了 操作 数据 的 方法 ， 并 且 与 UDT 
密切 相关 ， 提 供 了 UDT 所 需 的 行为 。 一 个 ORDBMS 应 该 在 这 一 领域 提供 极 大 的 灵活 性 ， 
例如 允许 UDR 返回 可 以 被 进一步 处 理 的 复杂 值 (例如 表 )， 并 且 为 简化 应 用 开发 而 支持 函数 


在 SQL:2011 中 ，UDR 可 以 被 定义 为 某 个 UDT 的 一 部 分 或 者 单独 作为 模式 的 一 部 分 。 
一 个 SOL 调用 例 程 (SQL-invoked routine) 可 以 是 一 个 过 程 、 函 数 或 者 方法 。SQL 调用 的 例 


程 既 可 以 是 用 C、C++ 或 者 Java 这 样 的 标准 高 级 程序 设计 语言 在 外 部 编写 的 ， 也 可 以 完全 
是 用 为 使 SQL 计算 完备 而 扩展 的 SQL 语句 定义 的 ， 这 部 分 内 容 我 们 将 在 9.5.10 市 讨论 。 


SQL 调用 过 程 (SQL-invoked procedure) 通过 SQL CALL 语句 调用 。SQL 调用 过 程 可 
能 有 和 零 个 或 多 个 参数 ， 每 个 参数 可 能 是 输入 参数 (IN)、 输 出 参数 (OUT)， 或 者 输入 输出 参 


数 (INOUT)， 如 果 该 过 程 完 全 在 SQL 内 定义 ， 则 定 有 一 个 过 程 体 。SQL 调用 函数 (SQL- 


invoked function) 将 返回 一 个 值 ，SQL 调用 函数 的 所 有 参数 都 必须 是 输入 参数 ， 其 中 一 个 输 
人 参数 可 以 (用 关键 字 RESULT) 指定 为 结果 ， 在 这 种 情况 下 ， 该 参数 的 数据 类 型 必须 和 返 


回 类 型 匹配 。 这 样 的 函数 也 被 称 为 类 型 保留 (type-preserving) 的 图 数 ， 因 为 其 返回 值 的 运 
但 还 是 有 一 些 重 要 的 区 别 : 


行 时 类 型 总 是 与 RETURN 参数 的 最 特殊 类 型 (参见 9.5.3 节 ) 相同 (而 不 是 该 类 型 的 随便 一 
e 方法 和 某 个 UDT 相关 联 。 
有 三 类 方法 : 


个 子 类 型 )。 变 换 器 函数 总 是 类 型 保留 的 .SQL 调用 方法 (SQL-invoked method) 与 函数 类 似 ， 


须 指 明 其 UDT (必须 与 UDT 同 在 一 个 模式 中 )。 


e 与 某 UDT 相关 联 的 方法 的 签名 ( signature) 必须 在 该 UDT 中 说 明 ， 方 法 定义 时 也 必 
è 构造 器 方法 。 初始 化 新 创建 的 UDT 实例 。 

© 实例 方法 。 作 用 于 某 个 UDT 实例 的 方法 。 
实例 这 一 层 。 


e 静态 方法 。 与 某 些 面 向 对 象 程序 设计 语 


一 


言 中 的 类 的 方法 类 似 ， 作 用 于 UDT 层 而 不 是 
前 两 种 方法 都 有 一 个 叫 作 SELF 的 隐 式 参数 ， 参 数 类 型 是 与 该 方法 相关 的 那 种 UDT 类 
型 。 我 们 已 经 看 过 一 个 SELF 参数 的 示例 ， 请 注意 PersonType 的 用 户 自 定义 的 构造 器 方法 。 
调用 方法 的 方式 有 三 种 : 
e 如 前 所 述 ， 通 过 NEW 表达 式 调 用 构造 器 方法 。 
StaffType).fName(). 


© 通过 标准 的 点 操作 符 调 用 实例 方法 ， 例 如 p.fName， 或 使 用 通用 调用 格式 ， 如 (p AS 
以 用 StaffType::totalStaff() 实现 调用 。 


e 使 用 :: 调用 静态 方法 ， 人 例如， 如果 totalStaff 是 StaffType 的 一 个 静态 方法 ， 我 们 可 
外 部 例 程 通过 外 部 子 句 定义 ， 外 部 子 句 指 出 在 操作 系统 的 文件 存储 中 对 应 的 已 编译 代 
CREATE FUNCTION 语句 来 实现 : 


码 。 例 如 ， 我 们 可 能 需要 使 用 为 数据 库 中 存储 的 某 个 对 象 创 建 缩 略 图 的 函数 。SQL 无 法 
提供 这 一 功能 ， 因 此 ， 我们 需要 使 用 外 部 提供 的 函数 ， 可 以 使 用 具有 EXTERNAL FAJK 
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CREATE FUNCTION thumbnail(IN myImage ImageType) RETURNS BOOLEAN 

EXTERNAL NAME ‘/usr/dreamhome/bin/images/thumbnail’ 

LANGUAGE C 

PARAMETER STYLE GENERAL 

DETERMINISTIC 

NO SQL; 

这 个 SQL 语句 将 名 为 thumbnail 的 SQL 函数 与 一 个 外 部 文件 关联 。 用 户 需 提供 这 个 
编译 过 的 函数 。 然 后 ORDBMS 要 提供 将 该 目标 文件 动态 链 入 数据 库 的 方法 ， 以 便 在 需要 
的 时 候 调用 。 实 现 该 方法 的 过 程 超出 了 SQL 标准 的 范围 ， 因 此 只 在 实现 层 做 了 规定 。 如 果 
一 个 例 程 对 于 给 定 的 同一 输入 集合 总 是 返回 相同 的 值 ， 那 么 就 称 它 是 确定 的 。NO SQL 指 
明 函 数 不 包含 SQL 语句 。 其 他 的 选项 还 有 READS SQL DATA, MODIFIES SQL DATA 和 
CONTAINS SQL. 


95.5 多 态 性 


在 附录 K.7 和 附录 K.8 节 ， 我 们 讨论 了 覆 写 、 重 载 和 更 一 般 化 的 概念 一 一 多 态 性 。 不 同 
的 例 程 可 以 具有 同一 个 名 字 ， 也 就 是 说 例 程 名 可 能 被 重 载 。 例 如 ， 可 以 允许 UDT 子 类 型 重 
新 定义 一 个 从 超 类 型 继承 的 方法 ， 并 服从 下 列 约束 : 

。 同一 个 模式 中 ， 不 允许 有 两 个 函数 具有 相同 的 签名 ， 即 同时 具有 相同 的 参数 个 数 ， 

并 且 每 个 参数 的 数据 类 型 和 返回 类 型 均 相同 。 

e 同一 个 模式 中 ,不 允许 有 两 个 过 程 具 有 相同 的 名 字 并 且 具 有 相同 个 数 的 参数 。 

覆 写 只 能 应 用 于 方法 ， 且 仅 基 于 隐 式 实 参 SELF 运行 时 的 值 (注意 : 方法 在 定义 时 拥有 
形 参 ， 被 调用 时 则 代入 的 是 实 参 )。SQL 采用 通用 对 象 模 型 ， 因 此 ， 在 决定 调用 哪个 例 程 时 ， 
需要 从 左 到 右 考 虑 所 有 实 参 的 类 型 。 当 实 参 的 数据 类 型 和 已 定义 形 参 的 数据 类 型 无 法 精确 匹 
配 时 ， 则 使 用 类 型 优先 表 来 确定 最 接近 的 匹配 。 至 于 如 何 确定 此 次 调用 的 被 调用 例 程 ， 规则 
十 分 复杂 ， 这 里 就 不 再 著述 ， 只 给 出 实例 方法 的 机 制 。 
实例 方法 调用 

确定 合适 的 被 调用 实例 方法 的 机 制 分 为 两 个 阶段 : 静态 分 析 阶 段 和 运行 时 执行 阶段 。 本 
节 对 这 两 个 阶段 进行 简单 介绍 。 第 一 阶段 的 过 程 如 下 : 

e 识别 所 有 具有 合适 名 字 的 例 程 (排除 其 他 例 程 )。 
排除 所 有 用 户 不 具有 其 EXECUTE 权限 的 过 程 / 函数 和 方法 。 
排除 所 有 与 隐 式 SELF 实 参 的 类 型 (或 子 类 型 ) 不 相 容 的 方法 。 
排除 所 有 形 参 个 数 和 调用 的 实 参 个 数 不 等 的 方法 。 

对 于 剩 下 的 方法 ， 系 统 将 每 一 个 形 参 的 数据 类 型 和 对 应 实 参 的 数据 类 型 优先 表 进 行 
匹配 ， 排 除 那 些 不 匹配 的 方法 。 

© 如 果 不 存在 可 用 的 候选 方法 ， 则 产生 一 个 语法 错误 。 

对 于 剩 下 的 候选 方法 ， 第 二 阶段 〈 运 行 时 ) 的 处 理 步骤 为 : 

e 如 果 方 法 调用 的 隐 式 实 参 的 运行 时 值 的 最 特殊 类 型 的 类 型 定义 中 包含 了 其 中 一 个 候 

选 方法 ， 则 选择 该 方法 执行 。 

e 如 果 方 法 调用 的 隐 式 实 参 的 运行 时 值 的 最 特殊 类 型 的 类 型 定义 中 不 包含 任何 一 个 候 

选 方法 ， 则 比较 各 个 候选 方法 的 对 应 类 型 ， 在 所 有 拥有 该 方法 的 超 类 型 中 选择 最 接 

近 该 最 特殊 类 型 的 那个 超 类 型 ， 并 执行 其 方法 。 
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如 果 执 行 某 个 方法 的 体 ， 则 实 参 的 值 要 转换 为 相应 形 参 的 数据 类 型 。 


95.6 引用 类 型 和 对 象 标识 


对 象 标识 是 对 象 永 远 不 变 的 部 分 ， 可 用 来 与 其 他 对 象 进行 区 分 ( 见 附 录 K.3 )。 理 想 情 
况 下 ， 对 象 标识 独立 于 对 象 的 名 字 、 结 构 和 位 置 。 即 使 在 对 象 被 删除 之 后 ， 其 对 象 标 识 依然 
持久 地 存在 ， 因 此 它 永 远 都 不 可 能 跟 任何 其 他 对 象 的 标识 混淆 。 其 他 对 象 可 以 把 一 个 对 象 的 
标识 当 作 对 该 对 象 进行 引用 的 唯一 方法 。 

直到 SQL:1999， 定 义 表 和 表 之 间 的 联系 的 方法 还 只 能 使 用 主 关键 宇 /外 部 关键 字 机 
制 ， 这 种 机 制 在 SQL2 中 是 用 引用 表 约 束 子 句 REFERENCES 表示 的 ， 参 见 7.2.4 节 。 从 
SQL:1999 开始 ， 可 以 使 用 引用 类 型 ( reference type) 定义 行 类 型 之 间 的 联系 ， 以 及 唯一 地 
标识 表 的 一 行 。 引 用 类 型 的 值 可 以 存储 在 (类 型 化 ) 表 中 ， 用 于 直接 引用 某 个 定义 为 该 类 型 
的 基本 表 中 指定 的 行 (类 似 于 C 或 C++ 中 的 指针 类 型 概念 )。 在 这 方面 ， 引 用 类 型 具有 与 
OODBMS 的 对 象 标 识 符 (OID) 类 似 的 功能 ， 参 见 附 录 K.3。 因 此 ， 引 用 允许 某 一 行 被 多 表 
共享 ， 并 且 使 得 用 户 能 够 将 查询 中 复杂 的 连接 定义 替换 为 简单 得 多 的 路 径 表 达 式 。 引 用 还 为 
优化 器 提供 了 基于 值 的 连接 之 外 的 另 一 种 遍历 数据 的 解决 方案 。 

CREATE TYPE 语句 中 的 REF IS SYSTEM GENERATED 表明 ， 相 应 的 REF 类 型 的 
实际 值 是 由 系统 提供 的 ， 参见 例 9.2 中 的 PersonType 创建 。 也 可 以 使 用 其 他 选项 ， 这 里 
不 再 详 述 ， 默 认 方 式 是 REF IS SYSTEM GENERATED。 稍 后 可 以 看 到 ， 基 本 表 可 以 被 创 
建 为 具有 某 种 结构 类 型 的 表 。 还 可 以 为 该 表 定 义 其 他 列 ,， 但 至 少 有 一 列 要 用 子 句 REF IS 
<columnName>SYSTEM GENERATED 定义 ， 即 至 少 要 有 一 个 REF 类 型 的 列 。 该 列 存储 了 
相应 的 基本 表 的 行 的 唯一 标识 符 。 当 某 一 行 被 插入 表 中 时 ， 就 为 该 行 分 配 了 一 个 标识 符 ， 并 
日 一 直 与 该 行 保持 关联 直至 其 被 删除 。 


9.5.7 ”创建 表 


为 了 向 上 兼容 SQL2 标准 ， 即 使 表 仅 由 一 个 UDT 构 成， 也 仍然 有 必要 使 用 CREATE 
TABLE 语句 来 创建 表 。 换 句 话 说，UDT 的 实例 只 有 被 作为 表 中 的 列 值 时 ， 才 能 持久 存储 。 
CREATE TABLE 语句 有 几 种 不 同 的 表达 形式 ， 如 例 9.4 至 例 9.6 所 示 。 


| 例 9.4 >> 基于 UDT 创建 表 
使 用 UDT PersonType 类 型 创建 表 ， 可 以 写 为 : 


CREATE TABLE Person ( 
info PersonType 
CONSTRAINT DOB _ Check CHECK(dateOfBirth > DATE 1900-01-01 )); 


或 者 写 为 : 


CREATE TABLE Person OF PersonType ( 
dateOfBirth WITH OPTIONS 
CONSTRAINT DOB Check CHECK (dateOfBirth > DATE 1900-01-01 ) 
REF IS PersoniD SYSTEM GENERATED); 


在 第 一 个 示例 中 ， 我 们 使 用 路 径 表 达 式 (如 Person.info.fName) 来 访问 Person 表 的 各 
列 ; 在 第 二 个 示例 中 ， 我 们 使 用 路 径 表 达 式 (如 Person.fName) 来 访问 表 的 各 列 。 « 


重要 的 是 ， 用 第 二 种 版 本 ( CREATE TABLE … OF 语句 ) 构造 的 表 称 为 类 型 化 表 。 类 
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型 化 表 的 行 被 看 作对 象 ， 但 第 一 种 版 本 中 的 行 则 不 然 ， 尽 管 两 种 情况 下 都 用 到 同一 个 UDT。 
类 型 化 表 中 对 应 其 基于 的 结构 类 型 的 每 个 属性 都 有 一 列 ， 此 外 表 的 每 行 还 有 一 个 自 引 用 列 
( self-referencing column) 内 含 唯 一 的 OID ( 叫 作 引用 )。 对 象 插入 类 型 化 表 也 使 用 通常 关系 
表 所 用 的 INSERT 语句。 除了 目 引 用 列 和 结构 类 型 的 那些 属性 外 ， 再 无 法 在 表 的 定义 中 加 入 
其 他 列 。 

当 一 个 新 行 插 入 类 型 化 表 时 目 动 产生 OID。 然 而 ， 为 了 访问 自 引 用 列 中 的 IOD ， 不 得 不 
用 REF IS 子 句 为 其 显示 命名 (本 例 为 PersonID )。 注 意 ， 在 类 型 化 表 的 定义 中 要 重复 说 明 一 
次 引用 如 何 产 生 一 一 是 系统 产生 、 用 户 产 生还 是 派生 ， 并 且 要 跟 该 表 基 于 的 UDT 中 的 对 应 
说 明 保持 一 致 。 


| 例 9.5 为 使 用 UNDER 子 句 创 建 子 表 
我 们 可 以 使 用 表 继 承 创建 一 张 员工 表 : 
CREATE TABLE Staff OF Stafffype UNDER Person; 


“4 [n] Staff 表 中 插入 行 时 ， 继承 列 的 值 也 被 插入 Person 表 。 同 样 ， 当 删除 Staff 表 中 的 
行 时 ， 该 行将 同时 从 Staff 表 和 Person 表 中 消失 。 因 此 在 访问 Person 表 的 所 有 行 时 ， 也 包含 
了 Staff 表 的 所 有 信息 。 << 


表层 次 上 的 行 存在 如 下 约束 : 

© EK Person 的 每 一 行 至 多 对 应 于 Staff 表 中 的 一 行 。 

e Staff 表 的 每 一 行 必 须 在 Person 表 中 有 一 个 确切 的 对 应 行 。 

维护 的 语义 是 所 谓 包 含 (containment) 语义 : 子 表 中 的 某 一 行 要 有 效 地 被 包含 在 超 表 中 。 
当 修改 子 表 和 超 表 的 行 时 ， 我 们 希望 SQL INSERT, UPDATE fil DELETE 语句 能 够 维护 这 
种 一 至 性， 如 下 所 示 (至 少 是 概念 上 的 ): 

e 当 癌 子 表 中 插入 一 行 时 ， 该 表 所 有 继承 列 的 值 都 要 插入 超 表 中 ， 并 在 表层 次 中 间 上 级 

联 。 例 如 在 图 9-4b 中 ， 如 果 我 们 向 PTStudentStaff 中 插入 一 行 ， 那么 各 继承 列 的 值 将 被 
插入 Student 表 和 Staff 表 中 ， 然 后 Student/Staff 的 各 继承 列 的 值 再 被 插入 Person Fo 

e 当 子 表 中 的 一 行 发 生 更 新 时 ， 类 似 于 上 面 的 过 程 ， 位 于 超 表 中 的 各 继承 列 的 值 也 要 
同时 更 新 。 

e 当 超 表 中 的 一 行 发 生 更 新 时 ， 则 其 直接 或 间接 子 表 的 所 有 对 应 行 的 所 有 继承 列 的 值 也 
要 随 之 更 新 。 当 超 表 目 身 也 是 一 个 子 表 时 ， 为 了 保证 一 致 性 ， 也 要 满足 上 面 的 条 件 。 

e 当 删 除 子 表 / 超 表 的 某 一 行 时 ， 表 层次 中 相应 的 行 也 要 被 删除 。 例 如 ， 如 果 我 们 删 
除了 Student 中 的 一 行 ， 则 Person 和 Undergraduate/Postgraduate/PartTimeStudent/ 
PTStudentStaff 中 相应 的 行 都 要 被 删除 。 

SQL:2011 没 提供 存储 给 定 UDT 的 所 有 实例 的 机 制 ， 除 非 用 户 显 示 创 建 一 个 表 来 存储 
实例 。 因 此 在 SQL:2011 下 ， 想 用 一 个 SQL 语句 检索 给 定 UDT 的 所 有 实例 可 能 不 可 行 。 例 
如 ， 若 创建 如 下 一 张 表 : 

CREATE TABLE Client ( 

info PersonType, 
preffype CHAR, 


maxRent DECIMAL(6, 2), 
branchNo WVARCHAR(4) NOT NULL); 
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现在 PersonType 的 实例 分 放 在 Staff Al Client 两 张 表 中 。 在 这 种 情况 下 ， 可 通过 用 
UNDER 子 句 定义 表 ， 继 承 已 存在 表 的 列 来 解决 问题 。 正 如 所 预期 的 那样 ， 子 表 继 承 超 表 的 
每 一 列 。 注 意 表层 次 中 的 所 有 表 必 须 具 有 同一 类 层次 中 对 应 的 类 ， 并 且 表 在 表层 次 中 的 位 置 
还 须 跟 类 在 类 层次 中 的 相对 位 置 一 致 。 然 而 并 不 要 求 类 层次 中 的 每 个 类 都 要 出 现在 表层 次 
中 ， 只 要 用 于 创建 表 的 那些 类 能 连 起 来 就 行 。 例 如 ， 观 察 图 9-4a， 若 除 Staff 外 ， 所 有 类 型 
都 创建 一 张 表 是 可 行 的 ; 但 若 为 Person 和 Postgraduate 各 创建 一 张 表 ， 而 不 为 Student 建 表 
则 行 不 通 。 还 要 注意 子 表 的 定义 中 无 法 另外 添加 列 。 


| 例 9.6 >> 使 用 引用 类 型 定义 联系 
在 这 个 例子 中 ， 使 用 引用 类 型 建立 PropertyForRent 和 Staff 之 间 的 联系 。 
CREATE TABLE PropertyForRent( 


propertyNo PropertyNumber NOT NULL, 

street Street NOT NULL, 

city City NOT NULL, 

postcode PostCode, 

type PropertyType NOT NULL DEFAULT ‘F’, 
rooms PropertyRooms NOT NULL DEFAULT 4, 
rent PropertyRent NOT NULL DEFAULT 600, 
stafflD REF(StaffType) SCOPE Staff 


REFERENCES ARE CHECKED ON DELETE CASCADE, 


PRIMARY KEY (propertyNo)); «<< 


”在 例 7.1 中， 我 们 使 用 传统 的 主 关键 字 / 外 部 关键 字 机 制 建 立 了 PropertyForRent 和 
Staff 之 间 的 联系 。 这 里 则 使 用 了 引用 类 型 REF ( StaffType) 为 联系 建 模 。SCOPE 子 句 指明 
了 关联 的 引用 表 。REFERENCES ARE CHECKED 表示 需要 保持 引用 完整 性 (可 选择 的 还 有 
REFERENCES ARE NOT CHECKED). ON DELETE CASCADE 对 应 于 SQL2 中 的 常规 引 
用 动作 。 注 意 ， 因 为 表 Staff 中 的 列 staffID 不 能 被 更 新 ， 因 此 不 需要 ON UPDATE 子 句 。 
权限 

要 想 创 建 一 个 新 的 子 类 型 ， 用 户 必须 在 被 引用 的 超 表 上 拥有 UNDER 权限 。 另 外 ， 用 户 
必须 在 新 表 引 用 的 任何 用 户 自 定义 类 型 上 拥有 USAGE 权限 。 


95.8 数据 查询 


SQL:2011 关于 表 的 查询 和 更 新 采用 了 与 SQL2 相同 的 语法 ， 当 然 还 扩展 了 各 种 对 象 处 
理 。 本 节 将 讨论 其 中 部 分 扩展 。 


| Bil 9.7 D 检索 特定 行 和 特定 列 
找 出 所 有 经 理 的 名 字 。 


SELECT s.IName 
FROM Staff s 
WHERE s.position = ‘Manager’; 


这 一 查询 在 WHERE FAPI T ARE SZ A BE SE PRAY position 来 访问 position 列 。 « 


| 5i 9.8 > 调用 用 户 自 定义 函数 
找 出 所 有 经 理 的 名 字 和 年 龄 。 
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SELECT s.IName, s.age 
FROM Staff s 
WHERE s.isManager; 


这 种 查找 经 理 的 方法 是 将 用 户 自 定 义 方法 isManager 作为 WHERE 子 句 的 谓词 。 如 果 某 
个 Staff 的 成 员 是 经 理 ， 则 该 函数 返回 布尔 值 TRUE (参见 例 9.3 )。 男 外 ， 这 一 查询 还 调用 
了 继承 来 的 虚 (观察 器 ) 函数 age 作为 SELECT 列表 的 一 个 元 素 。 « 


| 例 9.9 >> 使 用 ONLY 限制 选择 
找到 数据 库 中 所 有 年 龄 大 于 65 岁 的 人 的 姓名 。 


SELECT p.IName, p.fName 

FROM Person p 

WHERE p.age > 65; 

这 一 查询 不 仅 列 出 了 显 式 插 入 Person 表 的 行 的 信息 ， 而 且 还 列 出 了 被 显 式 插入 Person 
的 所 有 直接 或 间接 子 表 (本 例 为 Staff 和 Client) 的 行 的 信息 。 

假设 我 们 并 不 需要 所 有 人 的 详细 信息 ， 只 需要 Person 表 (不 包括 Person 的 任 一 子 表 ) 
的 某 些 实例 的 信息 ， 则 可 以 使 用 关键 字 ONLY : 

SELECT p.IName, p.fName 

FROM ONLY (Person) p 

WHERE p.age > 65; {< 
| 例 9.10 >> 间接 引用 运算 符 的 用 法 

找到 管理 房产 PG4 的 职员 的 名 字 。 


SELECT p.staffiD—->fName AS fName, p.staffiD->IName AS IName 

FROM PropertyForRent p 

WHERE p.propertyNo = ‘PG4’; 

在 路 径 表 达 式 中 使 用 引用 可 以 实现 利用 对 象 引用 的 行 遍 历 。 为 了 访问 某 一 引用 ， 需 要 使 
用 间接 引用 运算 符 ( ->)。 在 SELECT 语句 中 ， 一 般 用 p.staffID 来 访问 表 的 某 一 列 。 人 然而 在 
这 个 特殊 的 例子 中 ,该 列 是 对 Staff 表 的 行 的 引用 。 因 此 ， 必 须 使 用 间接 引用 运算 符 来 访问 
间接 引用 表 中 的 行 。 在 SQL2 中 ， 这 一 查询 需要 使 用 连接 或 舱 套 查询 才能 实现 。 

为 了 获得 管理 房产 PG4 的 职员 的 详细 信息 ， 而 不 仅仅 是 姓名 ， 可 以 使 用 下 面 的 查询 : 

SELECT DEREF(pstaffiD) AS Staff 


FROM PropertyForRent p 
WHERE p.propertyNo = ‘PG4’; 《< 


尽管 引用 类 型 与 外 部 关键 字 相 似 ， 但 存在 着 显著 的 差异 。 在 SQL:2011 中 ， 只 需要 将 引 
用 约束 定义 作为 表 定 义 的 一 部 分 ， 就 能 够 维护 引用 完整 性 。 引 用 类 型 自身 并 不 能 文 持 引用 完 
整 性 。 因 而 ， 不 能 混淆 SQL 的 引用 类 型 和 ODMG 的 对 象 模型 提供 的 引用 类 型 。 在 ODMG 
模型 中 ， 建 立 类 型 和 引用 完整 性 之 间 的 联系 的 OID 是 自动 定义 的 ， 我 们 将 在 28.2.2 HHA 
讨论 。 


95.9 Raw 


Æ (collection) 是 用 于 定义 其 他 类 型 的 集 的 类 型 构造 器 。 集 可 以 用 于 在 表 的 一 列 中 存储 
多 值 ， 从 而 导致 表 髓 套 ， 即 表 的 一 列 中 实际 包含 男 外 一 个 表 。 这 样 一 来 ,一 个 表 可 能 表示 多 
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个 主体 细节 层次 关系 。 因 此 ， 集 增加 了 物理 数据 库 结构 设计 的 灵活 性 。 

SQL:1999 引入 了 集 类 型 ARRAY ，SQL:2003 引入 了 集 类 型 MULTISET， 标 准 的 后 续 版 
本 还 会 引入 参数 化 的 集 类 型 LIST 和 SET。 不 管 哪 种 集 类 型 ， 被 称 为 元 素 类 型 的 参数 可 以 是 
一 个 预定 义 类 型 、UDT、 行 类 型 或 者 是 男 一 个 集 类 型 ， 但 不 可 以 是 一 个 引用 类 型 或 包含 了 引 
用 类 型 的 UDT。 为 外 ， 每 个 集 必 须 是 同 质 的 ， 即 所 有 元 素 必 须 是 同一 类 型 ， 或 至 少 来 自 相 
同 的 类 型 层次 。 集 类 型 具有 以 下 含义 : 

e ARRAY: 一 维 数 组 ， 有 最 大 个 数 的 限制 。 

e MULTISET: 允许 重复 的 无 序 集 。 

e LIST: 允许 重复 的 有 序 集 。 

e SET: 不 允许 重复 的 无 序 集 。 

这 些 类 型 与 28.2 节 将 讨论 的 ODMG 3.0 标 准 定义 的 类 型 是 相似 的 ， 只 是 用 SQL 
MULTISET 取代 了 Bag. 
集 类 型 ARRAY 

数组 是 一 个 元 素 值 不 必 互 斥 的 有 序 集 ， 通 过 数组 元 素 在 数组 中 的 位 置 来 引用 数组 元 素 。 
数组 的 声明 需要 指明 一 个 数据 类 型 ， 作 为 可 选项 ， 还 可 以 指定 数组 的 最 大 基数 ， 例 如: 

VARCHAR(25) ARRAY[5] 

可 以 通过 索引 访问 这 个 数组 的 元 素 ， 索 引 的 范围 是 从 1 到 最 大 基数 (函数 CARDINALITY 
将 返回 数组 中 当前 元 素 的 个 数 )。 当 且 仅 当 两 个 数组 具有 可 比较 的 类 型 且 基 数 相 同 ， 并 且 每 
一 对 相同 索引 序号 的 元 素 都 相等 时 ， 这 两 个 数组 才 是 同一 个 数组 。 

利用 数组 类 型 构造 器 可 以 声明 一 个 数组 类 型 ， 通 过 在 方 插 号 中 列举 出 所 有 元 素 的 方法 
来 定义 数组 类 型 ， 元 素 之 间 用 逗号 分 隐 开 ， 也 可 以 使 用 骨 套 层次 为 1 的 查询 表达 式 来 定义 。 
例如 : - 


ARRAY [ Mary White’, ‘Peter Beech’, ‘Anne Ford’, ‘John Howe’, ‘Alan Brand ] 
ARRAY (SELECT rooms FROM PropertyForRent) 


在 这 两 个 例子 中 ， 数 组 的 数据 类 型 是 由 其 数组 元 素 的 数据 类 型 决定 的 。 


| 例 9.11 >} Æ ARRAY 的 用 法 | 
为 了 表示 一 个 分 公司 最 多 只 能 有 3 个 电话 号 码 ， 我 们 可 以 将 该 列 定义 为 集 类 型 ARRAY : 
telNo VARCHAR(13) ARRAY[3] 
然后 ， 我 们 就 可 以 用 下 面 的 查询 语句 检索 分 公司 B003 的 第 一 个 电话 号 码 : 


SELECT telNo[1], telINo[CARDINALITY (telNo)] 
FROM Branch 
WHERE branchNo = ‘B003’; << 


集 类 型 MULTISET 

MULTISET 是 一 个 允许 元 素 重 复 的 无 序 集 ， 所 有 元 素 都 具有 相同 的 类 型 。 既 然 
MULTISET 是 无 序 的 ， 我 们 就 无 法 通过 序号 引用 MULTISET 的 元 素 。 和 数组 不 同 ， 
MULTISET 是 一 个 没有 大 小 限制 的 集 ， 不 需要 声明 最 大 基数 (尽管 有 实现 上 的 限制 )。 
MULTISET 和 表 很 类 似 ， 但 不 能 将 MULTISET 当 作 表 看 ， 系 统 提供 了 从 MULTISET 转换 到 
表 的 操作 符 (UNNEST) 以 及 从 表 转 换 到 MULTISET 的 操作 符 (MULTISET). 
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目前 ， 系 统 还 没有 为 集合 ( set) 提供 单独 的 类 型 。 不 过 ，set 可 以 看 作 MULTISET 的 特 
例 ， 即 没有 重复 元 素 的 MULTISET。 系 统 提供 了 一 个 判断 MULTISET 是 否 为 set 的 谓词 。 

对 于 两 个 具有 可 比 元 素 类 型 的 MULTISET (A 和 B)， 当 有 上 且 仅 当 它 们 具有 相同 的 基数 ， 
而 且 对 于 A 中 的 每 个 元 素 x，A 中 与 x 相同 的 元 素 的 个 数 (包括 x 自身 ) 等 于 B 中 与 x 相等 
的 元 素 的 个 数 ， 这 时 A 和 B 才 是 相等 的 。 与 数组 类 型 相同 ，MULTISET 类 型 构造 右 也 可 以 
通过 在 方 括号 中 列举 出 所 有 元 素 的 方法 来 定义 MULTISET 类 型 ， 元 素 之 间 用 逗号 分 开 ， th 
可 以 使 用 藤 套 层次 为 1 的 查询 表达 式 来 定义 ,或 者 使 用 表 值 构造 器 。 

可 以 作用 于 MULTISET 的 函数 有 : 

e SET: 去 掉 MULTISET 中 的 重复 元 素 ， 生 成 一 个 集合 。 

èe CARDINALITY: 返回 当前 元 素 的 个 数 。 

è ELEMENT : 如 果 MULTISET 中 只 有 一 个 元 素 ， 则 返回 该 元 素 ; 如 果 没 有 元 素 ， 则 
返回 null; WR MULTISET 中 的 元 素 多 于 一 个 ， 则 产生 异常 。 

MULTISET UNION : 计算 两 个 MULTISET 的 并 集 ， 关 键 字 ALL 或 者 DISTINCT 分 

别 表示 保留 和 去 掉 重 复元 素 。 

MULTISET INTERSECT : 计算 两 个 MULTISET 的 交集 。 关 键 字 DISTINCT 表示 去 

掉 重 复元 素 ， 关 键 字 ALL 表示 尽 可 能 多 地 保留 每 个 值 的 实例 ， 每 个 值 的 实例 个 数 取 

操作 数 中 该 值 实例 个 数 最 少 的 那个 。 

© MULTISET EXCEPT : 计算 两 个 MULTISET 的 差 。 同 样 ， 关 键 字 DISTINCT 表示 去 
掉 重 复元 素 ， 关 键 字 ALL 表示 将 确定 数量 的 某 个 值 的 实例 放 到 结果 中 ， 这 个 数量 等 
于 第 一 个 操作 数 的 该 值 的 实例 个 数 减 去 第 二 个 操作 数 的 该 值 的 实例 个 数 。 

还 有 三 个 新 的 可 作用 于 MULTISET 的 聚集 函数 : 

è COLLECT: 根据 一 个 分 组 (group) 的 每 一 行 的 实 参 的 值 创建 一 个 MULTISET。 

© FUSION: 计算 一 组 行 中 的 MULTISET 值 的 并 集 。 

e INTERSECTION: 计算 一 组 行 中 的 MULTISET 值 的 交集 。 

另外 ， 还 有 一 些 可 作用 于 MULTISET 的 谓词 : 

e 比较 谓词 (只 有 相等 和 不 等 )。 

DISTINCT 谓词 。 

MEMBER 谓词 。 

SUBMULTISET 谓词 : 测试 一 个 MULTISET 是 否 为 男 外 一 个 MULTISET 的 子 集 。 

IS A SET/IS NOT A SET 谓词 : 测试 一 个 MULTISET 是 否 为 一 个 集合 。 


| 例 9.12 》 MULTISET 的 用 法 
扩充 Staff 表 ， 使 之 包含 亲 威 的 一 些 信 息 ， 然 后 查找 John White 的 亲 威 的 名 和 和 姓 。 
我 们 在 Staff 中 增加 了 列 nextOfKin 的 定义 ， 如 下 所 示 ( NameType 包含 了 属性 fName 
和 IName): 


nextOfKin NameType MULTISET 
则 查询 为 : 


SELECT n.fName, n.IName 
FROM Staff s, UNNEST (s.nextOfKin) AS n(fName, IName) 
WHERE s.IName = ‘White’ AND s.fName = ‘John’; 
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注意 ， 在 FROM 子 句 中 ， 我 们 可 以 将 具有 MULTISET 值 的 字段 s.nextOfKin 当 作 表 来 
引用 。 « 


| 例 9.13 >> 聚集 函数 FUSION #0 INTERSECTION 的 用 法 
考虑 下 面 的 表格 PropertyViewDates ， 该 表 列 出 了 那些 有 意 租房 的 人 的 看 房 时 间 。 


propertyNo viewDates 
PA14 MULTISET['14-May-13', '24-May-13'] 
PG4 MULTISET['20-Apr-13', '14-May-13', '26-May-13'] 
PG36 MULTISET['28-Apr-13', '14-May-13'] 
PL94 Null 


下 面 的 查询 用 到 了 MULTISET 的 聚集 函数 : 


SELECT FUSION(viewDates) AS viewDateFusion, 
INTERSECTION (viewDates) AS viewDateintersection 
FROM PropertyViewDates; 


查询 产生 的 结果 集合 为 : 


viewDateFusion viewDatelntersection 


MULTISET['14-May-13', '14-May-13', 
'14-May-13', '24-May-13', '20-Apr-13', MULTISET['14-May-13'] 
'26-May-13', '28-Apr-13'] 


计算 FUSION 时 ， 先 去 掉 具有 null 的 行 (这 里 是 房产 PL94 所 在 的 行 )， 然 后 将 属于 剩 
下 的 三 个 MULTISET 的 元 素 都 复制 到 结果 集合 中 。 计 算 INTERSECTION H, CERERI 
具有 null 的 行 ， 然 后 查找 在 每 一 个 MULTISET 中 均 重 复出 现 的 元 素 。 《《 


9.5.10 ”类 型 视图 


SQL:2011 还 文 持 类 型 视图 ， 有 时 也 称 为 对 象 视图 或 引用 视图 。 类 型 视图 是 在 某 种 结构 
类 型 的 基础 上 创建 的 ， 基 于 类 型 视图 还 可 以 创建 子 视图 。 下 面 举例 说 明了 类 型 视图 的 用 法 。 


| 例 9.14 D 创建 类 型 视图 
下 面 的 语句 基于 结构 类 型 PersonType 和 StaffType 创建 了 两 个 视图 。 


CREATE VIEW FemaleView OF PersonType (REF IS personID DERIVED) 
AS SELECT fName, IName 
FROM ONLY (Person) 
WHERE sex = ‘F’; 


CREATE VIEW FemaleStaff3View OF Stafffype UNDER FemaleView 
AS SELECT fName, IName, staffNo, position 
FROM ONLY (Staff) 
WHERE branchNo = ‘B003’; 
其 中 , (REF IS personID DERIVED) 是 前 面 讨 论 过 的 自 引 用 列 的 说 明 。 该 子 句 
不 能 用 于 定义 子 视图 。 该 子 句 可 用 于 定义 最 大 的 超 视图 ， 但 是 不 能 同时 使 用 可 选项 
SYSTEM GENERATED， 只 能 用 USER GENERATED 或 DERIVED。 如 果 使 用 了 USER 
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GENERATED， 则 表示 视图 的 维 数 (degree) 将 大 于 相关 结构 类 型 的 属性 的 个 数 。 如 果 使 用 
了 DERIVED， 则 视图 的 维 数 和 结构 类 型 的 属性 个 数 相 等 ， 不 包含 其 他 的 自 引 用 列 。 
对 于 普通 视图 ， 新 列 名 的 说 明 可 以 使 用 子 句 WITH CHECK OPTION. « 


9.5.11 持久 化 存储 模块 


为 了 实现 计算 完备 性 ，SQL 增加 了 一 些 新 的 语句 类 型 ， 使 得 对 象 的 行为 (方法 ) 能 够 作 
为 SQL 语句 在 数据 库 中 存储 和 执行 。 我 们 在 8.1 节 已 讨论 过 这 些 语句 。 


9.5.12 触发 器 


触发 器 是 作为 某 指定 表 被 修改 后 的 一 种 副作用 (side effect) H DBMS 自动 执行 的 SQL 
(复合 ) 语句 。 和 触发 器 与 SQL 例 程 相似 ， 两 者 都 是 一 个 被 命名 的 SQL 块 ， 都 包括 声明 、 可 
执行 以 及 条 件 处 理 部 分 。 不 过 ， 与 例 程 不 同 的 是 ， 和 触发 器 是 在 触发 事件 发 生 时 隐 式 地 执行 ， 
并 且 不 含 任 何 参数 。 执 行 一 个 触发 硕 的 动作 有 时 被 称 为 激活 《firing) 该 触发 侨 。 触 发 器 可 
用 于 : 
o 对 输入 数据 进行 确认 ,维护 那些 通过 表 约 束 很 难 或 者 完全 不 可 能 实现 的 复杂 完整 性 
约束 。 
e 警告 (例如 通过 发 送 电子 邮件 ) 以 某 种 方式 更 新 表 时 会 采取 的 动作 。 
e 维护 审计 信息 ， 即 记录 下 谁 做 了 什么 修改 。 
e 支持 复制 ， 参 见 第 26 章 。 
CREATE TRIGGER 语句 的 基本 格式 如 下 : 
CREATE TRIGGER TriggerName 
BEFORE | AFTER | INSTEAD OF <triggerEvent> ON <TableName> 
[REFERENCING <oldOrNewValuesAliasList> | 
[FOR EACH {ROW | STATEMENT 


[WHEN (triggerCondition)] 
<triggerBody> 


触发 大 事件 包括 和 癌 表 中 插入 、 删 除 和 修改 某 些 行 。 在 最 后 一 种 情况 下 ， 触 发 器 事件 还 
可 被 设置 为 专门 针对 表 中 的 某 些 指定 的 列 。 触 发 器 的 触发 时 机 包括 BEFORE 和 AFTER。 
BEFORE 触发 器 在 有 关 事 件 发 生 之 前 被 激活 ，AFTER 触发 器 则 在 相关 事件 发 生 之 后 被 激活 。 
触发 器 动作 是 一 个 SQL 的 过 程 语句 ， 执 行 方式 包括 以 下 两 种 : 
e 在 受到 事件 影响 的 每 一 行 上 都 要 执行 一 次 (FOR EACH ROW )， 称 为 行 级 触发 器 。 
e 对 整个 事件 只 执行 一 次 (FOR EACH STATEMENT)， 这 是 默认 的 方法 ， 称 为 语句 级 
触发 器 。 
<oldOrNewValuesAliasList> 是 指 : 
© 各 为 行 级 触发 器 ， 则 为 带 有 旧 值 或 新 值 的 行 (OLD/NEW 或 者 OLD ROW/NEW 
ROW). 
e 二 为 语句 级 触发 器 ， 则 为 带 有 旧 值 或 新 值 的 表 (OLD TABLE/NEW TABLE). 
显然 ， 对 于 插入 事件 来 说 ， 旧 值 是 没有 意义 的 。 而 对 于 删除 事件 来 说 ， 新 值 是 没有 意义 
的 。 触 发 器 的 主体 不 可 以 包含 : 
e SQL 事务 语句 ， 如 COMMIT 或 者 ROLLBACK. 
© SQL 连接 语句 ， 如 CONNECT 或 者 DISCONNECT. 
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e SQL 模式 定义 或 者 操作 语句 ， 如 表 的 创建 或 删除 、 用 户 自 定义 类 型 或 者 其 他 触发 硕 。 
e SQL 会 话语 句 ， 如 SET SESSION CHARACTERISTICS, SET ROLE 和 SET TIME 
ZONE。 
此 外 ，SQL 不 支持 变异 触发 器 (mutating trigger)， 即 那些 致使 同一 个 触发 硕 被 再 次 调 
用 的 触发 器 ， 这 有 可 能 产生 死 循 环 。 当 同一 个 表 上 可 以 定义 多 个 触发 右 时 ， 触 发 硕 的 激活 顺 
序 就 很 重要 。 当 触发 器 事件 ( INSERT, UPDATE, DELETE) 执行 时 触发 器 被 激活 。 激 活 顺 
序 为 : 
(1) 执行 表 上 的 所 有 BEFORE 语句 级 触发 器 。 
(2 ) 对 被 语句 影响 的 每 一 行 : 
(a) 执行 所 有 BEFORE 行 级 触发 器 。 
(b) 执行 语句 自身 。 
(e) 应 用 引用 约束 。 
(d) 执行 所 有 AFTER 行 级 触发 器 。 
(3) 执行 表 上 的 所 有 AFTER 语句 级 触发 器 。 
注意 ， 按 照 这 样 的 顺序 ，BEFORE 触发 器 会 在 引用 完整 性 约束 被 检验 之 前 激活 。 因 此 ， 
导致 触发 器 被 调用 的 修改 请 求 可 能 回避 了 数据 库 的 完整 性 约束 检查 ， 将 不 得 不 被 葵 止 。 因 
而 ，BEFORE 触发 器 不 应 该 修改 数据 库 。 
如 果 在 同一 个 表 上 定义 了 多 个 触发 器 ， 并 且 触 发 事件 和 动作 的 时 机 (BEFORE 或 者 


AFTER) 均 相 同 ， 则 SQL 标准 规定 按照 触发 器 创建 的 顺序 执行 。 下 面 给 出 一 些 创 建 触 发 右 
的 实例 。 


| 例 9.15 >» AFTER INSERT 触发 器 的 用 法 
为 每 一 个 新 的 PropertyForRent 行 创 建 一 个 邮寄 广告 记录 集合 。 为 了 达到 这 个 目的 ， 假 
定 存在 一 张 记录 了 可 能 的 租赁 者 和 房产 的 详细 信息 的 邮寄 广告 表 Mailshot。 
CREATE TRIGGER InsertMailshotTable 
AFTER INSERT ON PropertyForRent 
REFERENCING NEW ROW AS pfr 
BEGIN ATOMIC 
INSERT INTO Mailshot VALUES 
(SELECT c.fName, c.lIName, c.maxRent, pfr.propertyNo, 


pfr.street, pfr.city, pfr.postcode, pfr.type, pfr.rooms, 
pfr.rent 
FROM Client c 


WHERE c.branchNo = pfr.branchNo AND 
(c.preffype = pfr.type AND c.maxRent <= pfr.rent)) 


END; 

该 触发 器 在 新 行 被 插 人 后 开始 执行 。 若 没有 出 现 FOR EACH 子 句 ， 则 默认 为 FOR 
EACH STATEMENT 方式 ， 因 为 每 条 INSERT 语句 每 次 只 能 向 表 中 插入 一行。 触发 器 的 主体 
是 一 条 基于 找到 所 有 相 匹 配 的 客户 行 的 子 查 询 的 INSERT 语句 。 (< 


| 例 9.16 » 带 有 条 件 的 AFTER INSERT 触发 器 的 用 法 
创建 一 个 触发 器 ， 当 房产 租赁 状况 发 生 改 变 时 ,修改 所 有 的 当前 邮寄 广告 记录 。 


CREATE TRIGGER UpdateMailshotTable 
AFTER UPDATE OF rent ON PropertyForRent 
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REFERENCING NEW ROW AS pfr 

FOR EACH ROW 

BEGIN ATOMIC 
DELETE FROM Mailshot WHERE maxRent > pfr.rent; 
UPDATE Mailshot SET rent = pfr.rent 
WHERE propertyNo = pfr.propertyNo; 

END; 

该 触发 器 在 PropertyForRent 77 fy rent F Pt wk BH ZITAT. fh A He PE SS FOR 
EACH ROW 子 句 ， 因 为 在 一 个 更 新 语句 中 可 能 会 把 所 有 房产 的 租金 都 提高 了 ， 例 如 当 生 活 
成 本 增加 时 。 触 发 器 主体 包含 两 个 SQL 语句 : DELETE 语句 ， 用 于 删除 那些 新 的 房租 价格 
超出 了 客户 的 价格 范围 的 邮寄 广告 记录 ; 以 及 UPDATE 语句 ， 用 于 修改 所 有 与 该 房产 相关 


的 行 以 包含 新 的 房租 价格 。 « 


如 果 使 用 得 当 ， 触 发 器 是 一 种 功能 强大 的 机 制 。 其 主要 优点 是 可 以 将 标准 函数 存储 在 
数据 库 中 ,并且 一 致 地 强制 实施 所 有 对 数据 库 的 更 新 。 这 可 以 极 大 地 降低 应 用 的 复杂 性 。 然 
而 ， 和 触发 需 的 缺点 包括 : 

e 复杂 性 。 当 功能 从 应 用 级 实现 转移 到 数据 库 级 实现 时 ， 数 据 库 的 设计 、 实 现 和 管理 

任务 就 变 得 更 加 复杂 。 
© 隐蔽 了 功能 。 功 能 转移 到 了 数据 库 以 后 ， 被 作为 一 个 或 者 多 个 触发 句 存 储 起 来 ， 这 
种 处 理 使 得 功能 对 用 户 不 可 见 。 在 简化 了 用 户 工 作 的 同时 ， 这 还 可 能 产生 一 些 副 作 
用 ， 即 可 能 引发 一 些 计 划 外 的 、 不 希望 发 生 的 错误 效应 。 数 据 库 中 发 生 的 一 切 也 不 
再 是 在 用 户 的 掌控 之 中 。 

© 性 能 开销 。 当 DBMS 将 要 执行 修改 数据 库 的 语句 时 ， 需 要 评估 触发 条 件 以 检测 是 否 
存在 能 够 被 该 语句 激活 的 触发 器 。 这 是 DBMS 的 一 个 隐 式 的 性 能 问题 。 显 然 ， 当 触 
发 器 的 个 数 增加 时 ， 这 种 开销 也 随 之 增加 。 在 峰值 时 刻 ， 这 种 开销 可 能 会 导致 性 能 
问题 。 

权限 

为 了 创建 触发 器 ， 用 户 必 须 在 指定 表 上 拥有 TRIGGER 权限 , 在 WHEN 子 句 的 trigger- 
Condition 中 引用 的 所 有 表 上 拥有 SELECT 权限 ， 并 且 还 要 拥有 在 触发 体 中 执行 SQL 语句 所 
需 的 所 有 权限 。 


9.5.13 AWK 


大 对 象 是 一 种 包含 了 大 量 数据 的 数据 类 型 ， 例 如 一 个 很 大 的 文本 文件 或 者 图 形 文件 。 
SQL:2011 中 定义 了 三 种 不 同类 型 的 大 对 象 : 

o 二 进 制 大 对 象 (Binary Large Object, BLOB): 一 个 二 进 制 串 ， 不 包含 字符 集 或 者 其 

他 与 字符 有 关 的 集 类 型 。 
e 字符 大 对 象 (Character Large Object, CLOB) 和 通用 字符 大 对 象 (National Character 
Large Object, NCLOB) 都 是 字符 串 。 

SQL 大 对 象 与 原来 出 现在 某 些 数据 库 系 统 中 的 BLOB 类 型 略 有 不 同 。 在 那些 系统 中 ， 
BLOB 是 一 个 未 经 解释 的 字 节 流 ， 并且 DBMS 也 没有 任何 关于 BLOB 的 内 容 或 者 其 内 部 结 
构 的 知识 。 这 就 使 得 DBMS 无 法 对 那些 原本 内 涵 丰 富 并 且 为 结构 化 的 数据 (如 图 像 、 视 频 、 
字 处 理 文档 或 者 网 页 ) 进行 查询 和 处 理 。 通 常 ， 在 对 BLOB 进行 任何 处 理 之 前 ， 都 需要 将 全 
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部 BLOB 数据 从 DBMS 服务 器 通过 网 络 传输 到 客户 端 。 然 而 ，SQL 大 对 象 允 许 在 DBMS 的 
服务 器 上 执行 某 些 操作 。 标 准 串 操作 作用 于 字符 串 并 且 返 回 字 符 串 ， 也 能 作用 于 字符 大 对 
象 ， 包 括 : 

o 连接 运算 符 ( string] || string2): 将 字符 串 操作 数 按 指 定 顺 序 连 接 ， 并 将 连接 后 的 字 

符 串 返回 。 

o 字符 子 串 函数 SUBSTRING(string FROM startpos FOR length); 返回 在 给 定 串 (string) 
中 从 起 始 位 置 (startpos) 按照 指定 长 度 (length) 提取 出 的 串 。 
字符 覆盖 函数 OVERLAY (stringl PLACING string2 FROM startpos FOR length) : 
将 string] 的 从 startpos 位 置 开 始 长 度 为 length 的 子 串 用 string2 替换 。 该 操作 等 价 
F SUBSTRING ( string] FROM 1 FOR startpos-1 ) || string2 || SUBSTRING ( string] 
FROM startpos + length). 
HÆ% UPPER (string) #l LOWER(string): 将 串 中 所 有 的 字符 转换 为 大 写 /小 写 。 
剪裁 函数 TRIM ( [LEADING | TRAILING | BOTH string] FROM]string2 ): #4 $ 
string2 的 首部 或 尾部 包含 了 指定 的 串 string1， 则 将 其 去 除 。 如 果 没 有 指明 FROM F 
句 ， 则 去 除 串 string2 的 首部 和 尾部 的 所 有 空格 。 
e KJÆR% CHAR LENGTH(string): 返回 指定 串 的 长 度 。 
位 置 函数 POSITION(string1 IN string2): 返回 串 stringl 在 串 string2 中 的 起 始 位 置 。 

尽管 CLOB $7 WAI LIKE 谓词 以 及 使 用 等 于 (==) 或 不 等 于 ( 关 ) 运算 符 进行 定性 
或 者 定量 比较 的 谓词 , 但 是 ，CLOB 串 不 能 参与 绝 大 多 数 比 较 操 作 。 由 于 这 些 限制 ， 和 定义 为 
CLOB 串 的 列 不 能 出 现在 下 列子 名 或 者 操作 中 : GROUP BY FAJ, ORDER BY FA, "E— 
或 者 引用 约束 定义 、 连 接 列 或 者 集合 操作 (UNION, INTERSECT 和 EXCEPT). 

BLOB 串 被 定义 为 一 个 字 节 序列 。 所 有 BLOB 串 的 比较 都 是 通过 将 相同 位 置 序号 的 字 
节 进 行 比 较 而 实现 的 。 下 面 的 操作 可 以 作用 于 BLOB 串 ， 返 回 值 也 是 BLOB 串 ， 其 功能 与 
前 面 的 定义 相似 : 

© BLOB 连接 运算 符 (||)。 

e BLOB 子 串 函数 (SUBSTRING). 

e BLOB # mr% (OVERLAY). 

© BLOB 39 PAR (TRIM). 

此 外 ，BLOB LENGTH fil POSITION 函数 以 及 LIKE 谓词 也 适用 于 BLOB 串 。 


| 例 9.17 >> CLOB 和 BLOB 的 用 法 
扩展 Sta 任 表 以 存储 员工 的 简历 和 照片 。 


ALTER TABLE Staff 

ADD COLUMN resume CLOB(50K); 
ALTER TABLE Staff 

ADD COLUMN picture BLOB(12M); 


ERREGEK Sta 任 中 添加 了 两 个 新 的 列 : 一 个 是 长 度 为 50 K 的 CLOB 类 型 的 列 resume, 
另 一 个 是 长 度 为 12 M 的 BLOB 类 型 的 列 picture。 大 对 象 的 长 度 可 以 是 一 个 单位 为 K、M 或 


G 的 数值 (K 表示 千 字 节 ，M 表示 兆 字 节 ，G 表示 千 兆 字 节 )。 如 果 没 有 指明 ， 则 默认 长 度 
由 具体 实现 决定 。 « 
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9.5.14 #4 


在 9.2 节 ， 我 们 讨论 了 RDBMS 在 处 理 递归 查询 时 遇 到 的 困难 。 对 于 此 类 查询 ，SQL 中 
新 增 的 一 个 主要 操作 是 线性 递归 (linear recursion ) 。 我 们 已 在 8.4 节 讨 论 过 。 


96 Oracle 中 面向 对 象 的 扩展 


在 附录 H， 我 们 对 Oracle 的 一 些 标准 机 制 进行 了 分 析 ， 包 括 Oracle 支持 的 基本 数据 类 
型 、 过 程式 程序 设计 语言 PL/SQL FF fifi Fe Al PR 2 fh HE. TERT AY SQL:2011 标准 中 
出 现 的 许多 面向 对 象 的 特性 也 以 这 样 或 者 那样 的 形式 出 现在 了 Oracle 中 。 本 节 将 简要 地 讨 
论 一 下 Oracle 的 一 些 面向 对 象 特征 。 


96.1 ”用户 自 定 义 数 据 类 型 


除了 支持 已 在 H.2.3 节 中 讨论 的 那些 预定 义 数据 类 型 以 外 ，Oracle 还 支持 两 种 用 户 自 定 
义 的 数据 类 型 : 对 象 类 型 和 集 类 型 。 
对 象 类 型 

对 象 类 型 是 一 个 模式 对 象 ， 它 具有 名 字 、 一 组 具有 预定 义 数据 类 型 或 者 其 他 对 象 类 型 
的 属性 和 一 组 方法 ， 类 似 于 我 们 已 经 讨论 过 的 SQL:2011 的 对 象 类 型 。 例 如 ， 可 以 这 样 创 建 
Address, Staff 和 Branch 类 型 . 


CREATE TYPE AddressType AS OBJECT ( 
street VARCHAR2(25), 
city VARCHAR2(15), 
postcode VARCHAR2(8)); 


CREATE TYPE Stafffype AS OBJECT ( 
staffNo VARCHAR2(5), 


fName VARCHAR2(15), 
IName VARCHAR2(15), 
position VARCHAR2(10), 
sex CHAR, 
DOB DATE, 
salary DECIMAL(7, 2), 


MAP MEMBER FUNCTION age RETURN INTEGER, 

PRAGMA RESTRICT _REFERENCES(age, WNDS, WNPS, RNPS)) 
NOT FINAL; 
CREATE TYPE BranchType AS OBJECT ( 

branchNo VARCHAR2(4), 

address AddressT ype, 
MAP MEMBER FUNCTION getbranchNo RETURN VARCHAR2(4), 
PRAGMA RESTRICT_REFERENCES(getbranchNo, WNDS, WNPS, 

RNDS, RNPS)); 


然后 ， 可 以 用 下 述 语句 创建 Branch (WA) K: 

CREATE TABLE Branch OF BranchType (branchNo PRIMARY KEY); 

于 是 就 创建 了 表 Branch, 4 T Fi) branchNo 和 类 型 为 AdressType 的 列 address, # 
Branch 的 每 一 行 都 是 一 个 BranchType 类 型 的 对 象 。 其 中 PRAGMA 子 句 告诉 编译 器 成 员 函 
数 不 能 对 数据 库 表 和 包 变 量 进行 读 / 写 访问 (WNDS 表示 不 能 修改 数据 库 表 ，WNPS 表示 不 
能 修改 包 变 量 ，RNDS 表示 不 能 查询 数据 库 表 ，RNPS 表示 不 能 引用 包 变 量 )。 本 例 还 给 出 
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了 Oracle 的 另外 一 个 对 象 - 关系 的 特性 ， 即 方法 的 定义 。 
方法 
对 和 象 类 型 的 方法 分 为 成 员 (member) HE., HA (static) 方法 和 比较 (comparison) 方 
法 三 种 。 成 员 方 法 是 一 个 总 是 将 隐 式 SELF BR (其 类 型 就 是 所 包含 对 象 的 类 型 ) 作为 其 
第 一 个 参数 的 图 数 或 者 过 程 。 这 种 方法 作为 观察 器 函数 和 变换 器 函数 都 是 很 有 用 的 ， 并 
有 目 是 以 自主 方式 (selfish style) 被 调用 。 例 如 object.method(), method 可 以 在 object 的 属 
性 中 找到 所 有 的 实际 参数 。 在 新 类 型 BranchType 中 我 们 已 经 定义 了 一 个 观察 器 成 员 方法 
getbranchNo， 稍 后 给 出 该 方法 的 具体 实现 。 
静态 方法 是 一 个 没有 隐 式 SELF 参数 的 图 数 或 过 程 。 这 种 方法 可 以 用 于 说 明 用 户 自 定义 的 
RAE cast 转换 方法 ， 并且 通过 按 类 型 名 进行 匹配 的 方法 调用 ， 比 如 typename.method()。 
比较 方法 用 于 对 象 类 型 的 实例 之 间 的 比较 。Oracle 提供 了 两 种 方法 ， 以 确定 给 定 类 型 的 
对 象 之 间 的 顺序 关系 : 
© 映射 (map) 方法 利用 Oracle 的 能 力 比较 预定 义 类 型 。 在 先前 的 例子 中 ， 已 经 为 新 类 
型 BranchType 定义 了 一 个 映射 方法 ， 就 是 依据 branchNo 属性 值 对 两 个 分 公司 对 象 
进行 比较 。 稍 后 将 给 出 该 方法 的 实现 。 
e HEF (order) 方法 利用 自己 内 部 的 逻辑 对 两 个 给 定 类 型 的 对 象 进 行 比 较 。 该 方法 返 
回 的 值 为 对 顺序 关系 的 编码 。 例 如 ， 如 果 第 一 个 对 象 较 小 ， 返 回 一 1 ; 如 果 两 者 相 
等 ， 返 回 0; 如 果 第 一 个 对 象 较 大 ， 返 回 1。 
对 于 一 个 对 象 类 型 来 说 ， 要 么 定义 一 个 映射 方法 ， 要么 定义 一 个 排序 方法 ,但 是 不 能 同 
时 定义 两 种 方法 。 如 果 某 个 对 象 类 型 没有 定义 比较 方法 ， 那 么 Oracle 就 无 法 对 该 类 型 的 两 
个 对 象 之 间 的 顺序 关系 进行 判断 ， 即 无 法 判断 谁 大 谁 小 。 不 过 ， 可 以 利用 下 述 规则 判断 该 类 
型 的 两 个 对 象 是 否 相 等 : 
e 如 果 所 有 属性 非 空 并 且 相 等 ， 则 可 视 为 相等 。 
e 如 果 两 个 对 象 有 一 属性 ， 其 值 非 空 且 不 等 ， 则 视 为 不 等 。 
e Ail, Oracle 将 报告 无 法 进行 比较 (null). 
可 以 用 PL/SQL, Java 和 C 等 语言 实现 方法 ， 并 且 支 持 重 载 ， 但 形 参 的 个 数 、 顺 序 或 者 
数据 类 型 要 有 所 不 同 。 下 面 为 在 前 例 的 类 型 BranchType 和 StaffType 中 定义 的 成 员 函 数 创 建 
PRIA A : 


CREATE OR REPLACE TYPE BODY BranchType AS 
MAP MEMBER FUNCTION getbranchNo RETURN VARCHAR2(4) IS 
BEGIN 
RETURN branchNo; 
END; 
END; 
CREATE OR REPLACE TYPE BODY StaffType AS 
MAP MEMBER FUNCTION age RETURN INTEGER IS 
var NUMBER; 
BEGIN 
var := TRUNC(MONTHS_BETWEEN(SYSDATE, DOB)/12); 
RETURN var; 
END; 
END; 
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WM K% getbranchNo 不 仅 作为 观察 怖 方法 返回 branchNo 属性 的 值 ， 而 且 还 作为 该 类 
型 的 比较 (映射 ) 方法 。 稍 后 可 以 看 到 该 方法 的 一 个 应 用 示例 。 在 SQL:2011 中 ， 用 户 自 定 
义 困 数 也 能 在 CREATE TYPE 语句 之 外 单独 声明 。 通 常 ， 用 户 自 定义 函数 可 以 用 于 : 

è SELECT 语句 的 选择 列表 

© WHERE 子 句 的 条 件 

è ORDER BY 或 者 GROUP BY 子 句 

e INSERT 语句 的 VALUES 子 句 

© UPDATE 语句 的 SET 子 句 

Oracle 还 允许 使 用 CREATE OPERATOR 语句 创建 用 户 自 定义 的 运算 符 。 与 预定 义 运算 
符 一 样 ， 用 户 自 定 义 运算 符 以 一 组 操作 数 作 为 输入 ， 并 返回 一 个 结果 。 新 运算 符 一 旦 定义 ， 
就 可 以 像 其 他 预定 义 运 算 符 那样 在 SQL 语句 中 使 用 。 

构造 器 方法 。 每 个 对 象 类 型 都 有 一 个 系统 定义 的 构造 器 方法 ， 根 据 对 象 类 型 的 定义 创建 
一 个 新 的 对 象 。 构 造 器 方法 与 对 象 类 型 同名 ， 其 参数 与 对 象 类 型 的 属性 的 名 称 和 类 型 相同 。 
例如 ， 可 以 使 用 下 述 表 达 式 创建 BranchType 的 一 个 实例 : 

BranchType(B003`, AddressType( 163 Main St’, ‘Glasgow’, ‘G11 9QX’)); 


注意 ， 表 达 式 AddressType ( ‘163 Main St’, * Glasgow’, < G11 9QX’ ) 本 身 又 是 对 
AddressType Š HHI E Ar 77 EW —T a A. 
对 象 标 识 符 

对 象 表 中 的 每 一 个 行 对 象 (row object) 都 有 一 个 相关 的 逻辑 对 象 标 识 符 (OID)， 默 认 情 
况 为 分 配给 每 个 行 对 象 的 、 系 统 生成 的 唯一 标识 符 。OID 的 目标 是 唯一 标识 对 象 表 中 的 一 个 
行 对 象 。 为 此 , Oracle 隐 式 地 创建 和 维护 了 对 象 表 OID 列 的 一 个 索引 , OID 列 对 用 户 不 可 见 ， 
因此 用 户 无 法 访问 其 内 部 结构 。 虽 然 OID 值 本 身 没有 什么 意义 ,但 是 可 以 根据 OID 获取 和 
遍历 对 象 (注意 ， 出 现在 对 象 表 中 的 对 象 称 为 行 对 象 ， 占 用 关系 表 的 一 列 或 者 作为 其 他 对 象 
的 属性 的 对 象 称 为 列 对 象 ) 。 

Oracle 要 求 每 个 行 对 象 都 具有 一 个 唯一 的 OID。OID 的 值 可 以 在 CREATE TABLE 语句 
中 使 用 OBJECT IDENTIFIER PRIMARY KEY 或 者 OBJECT IDENTIFIER SYSTEM GENERATED 
(默认 ) 分 别 说 明 由 行 对 象 的 主 关键 字 定 义 还 是 由 系统 生成 。 例 如 ， 我 们 可 以 这 样 重 新 创建 
表 Branch : 


CREATE TABLE Branch OF BranchType (branchNo PRIMARY KEY) 
OBJECT IDENTIFIER IS PRIMARY KEY; 


REF 数据 类 型 

Oracle 提供 了 一 个 称 为 REF 的 预定 义 数 据 类 型 ， 用 于 封装 对 某 给 定 对 象 类 型 的 行 对 象 
的 引用 。 效 果 上 , H REF 可 以 模拟 两 个 行 对 象 之 间 的 关联 。REF 可 以 用 于 查看 、 更 新 其 所 指 
对 象 ， 或 获取 其 所 指 对 象 的 副本 。 对 REF 唯一 可 进行 的 修改 操作 是 替换 为 同一 对 象 类 型 的 男 
一 对 象 的 引用 ,或 者 为 其 指派 一 个 null 值 。 在 实现 上 ，Oracle 使 用 对 象 标 识 符 来 定义 REF. 

在 SQL:2011 中 ， 可 以 用 SCOPE 子 句 限制 REF 只 包含 对 指定 对 象 表 的 引用 。 当 REF 标 
识 的 对 象 出 现 不 可 用 的 情况 时 ， 例 如 对 象 被 删除 ，Oracle SQL 可 以 用 谓词 IS DANGLING 来 
对 REF 进行 测试 ， 判 断 是 否 发 生 了 这 种 情况 。Oracle 还 提供 一 个 间接 引用 运算 符 DEREF ， 
用 于 访问 由 REF 指向 的 对 象 。 例 如 ， 为 了 建立 分 公司 经 理 的 信息 ， 可 以 将 类 型 BranchType 
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的 定义 修改 为 : 
CREATE TYPE BranchType AS OBJECT ( 
branchNo VARCHAR2(4), 
address AddressType, 
manager REF StaffType, 
MAP MEMBER FUNCTION getbranchNo RETURN VARCHAR2(4), 
PRAGMA RESTRICT_REFERENCES(getbranchNo, WNDS, WNPS, 
RNDS, RNPS)); 
在 本 例 中 ， 我 们 通过 引用 类 型 (REF StaffType) 增加 了 经 理 的 信息 。 稍 后 会 给 出 一 个 示 
例 ， 以 说 明 如 何 访问 该 列 。 
类 型 继承 
Oracle 支持 单 重 继承 ， 人 允许 从 一 个 父 类 型 导出 子 类 型 。 子 类 型 继承 父 类 型 的 全 部 属性 
和 方法 ， 还 可 以 增加 新 的 属性 和 方法 ， 并 且 可 以 覆 写 任 一 继承 来 的 方法 。 正 如 SQL:2011 一 
HE, WEA UNDER 子 句 定义 子 类 型 。 
集 类 型 
目前 ，Oracle 支持 两 种 集 类 型 : BZA SEY AIRE. 
数组 类 型 。 数 组 (array) 是 数据 元 素 的 一 个 有 序 集合 ， 所 有 元 素 的 数据 类 型 都 相同 。 每 
个 元 素 都 有 一 个 索引 (index)， 索 引 是 一 个 数字 ， 对 应 于 元 素 在 数组 中 的 位 置 。 数 组 的 长 度 
既 可 以 是 固定 的 ， 也 可 以 是 可 变 的 ， 但 在 后 一 种 情况 下 ， 声 明 数 组 类 型 时 须 指 明 最 大 长 度 。 
例如 ， 一 个 分 公司 的 办 公 室 可 能 最 多 有 三 个 电话 号 码 ， 我 们 可 以 在 Oracle 中 通过 定义 一 个 
新 类 型 来 表示 这 些 信息 : 
CREATE TYPE TelNoArrayType AS VARRAY(3) OF VARCHAR2(13); 
创建 数组 类 型 时 并 不 分 配 空间 ， 而 仅仅 是 定义 了 一 个 可 以 用 在 下 列 情况 中 的 数据 类 型 ; 
© 关系 表 列 的 数据 类 型 
© 对 象 类 型 的 属性 
© PL/SQL 的 变量 、 参 数 的 类 型 或 者 函数 的 返回 类 型 
例如 ， 我 们 可 以 修改 类 型 BranchType， 以 包含 下 面 这 个 新 类 型 的 属性 : 


phoneList TelNoArrayType, 


数组 通常 是 顺序 存储 的 ， 也 就 是 说 ， 与 该 行 的 其 他 数据 位 于 同一 个 表 空 间 。 但 是 ， 如 采 
数组 足够 大 ， 则 Oracle 会 将 其 存储 为 一 个 BLOB。 

嵌 套 表 。 散 套 表 是 数据 元 素 的 一 个 无 序 集合 ， 所 有 数据 元 素 的 类 型 都 相同 。 舱 套 表 只 有 
一 列 ， 该 列 可 以 为 预定 义 类 型 也 可 以 为 对 象 类 型 。 如 果 该 列 为 对 象 类 型 ， 那 么 表 就 可 以 看 作 
是 一 个 包含 多 列 的 表 ， 对 象 类 型 的 每 一 个 属性 为 一 列 。 例 如 ， 为 了 记录 全 体 员工 的 家 属 ， 我 
们 可 以 定义 一 个 新 的 类 型 : 

CREATE TYPE NextOfKinType AS OBJECT ( 

fName VARCHAR2(15), 
IName VARCHAR2(15), 


telNo VARCHAR2(13)); 
CREATE TYPE NextOfkinNestedType AS TABLE OF NextOfkinType; 


Ra tEAM Stafflype, HAA IK— PMR A—TiRKER : 
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nextOfKin NextOfKinNestedT ype, 


并 且 使 用 下 述 语句 创建 表 Staff: 
CREATE TABLE Staff OF StaffType ( 
PRIMARY KEY staffNo) 
OBJECT IDENTIFIER IS PRIMARY KEY 
NESTED TABLE nextOfKin STORE AS NextOfKinStorageTable ( 
(PRIMARY KEY(Nested_Table_Id, IName, telNo)) 
ORGANIZATION INDEX COMPRESS) 
RETURN AS LOCATOR; 

ite Ze HY 17 KE TE TP I Fe, AP CR al, (AA TEP, E 
DDL 语句 中 可 以 引用 。 存 储 表 中 有 一 个 隐藏 的 列 一 一 Nested_Table_Id,， 与 其 相应 的 父 行 匹 
配 。 对 于 来 自 Sta 任 中 某 一 行 的 舱 套 表 的 所 有 元 素 ， 其 Nested_Table_Id 的 值 都 相同 ， 属 于 
Staff 表 的 不 同行 的 元 素 则 具有 不 同 的 Nested_Table Id 值 。 

RME ZAH iE K nextOfKin 的 行 存 储 在 一 个 单独 的 存储 表 一 一 NextOfKinStorage- 
Table 中 。 在 STORE AS 子 句 中 ,也 已 经 说 明 存 储 表 是 按 索 引 组 织 的 (ORGANIZATION 
INDEX)， 以 便 将 属于 同一 个 父 行 的 行 聚集 存储 。COMPRESS 说 明了 对 拥有 同一 个 父 行 的 所 
有 行 ， 其 索引 关键 字 的 Nested_Table Id 部 分 仅 存储 一 次 ， 而 不 是 为 属于 同一 父 行 对 和 象 的 每 
一 行 都 重复 存储 。 

说 明 Nested_Table Id 和 指定 的 那些 属性 为 存储 表 的 主 关键 字 的 目的 有 两 个 : 一 是 作为 
索引 关键 字 ; 二 是 强调 在 父 表 每 一 行 的 藤 套 表 中 列 (IName，telNo) 的 唯一 性 。 通 过 如 此 构 
成 的 关键 字 ， 可 确保 在 每 位 员工 名 下 这 些 列 的 取 值 都 不 相同 。 

Oracle 封装 了 集 类 型 的 值 。 因 此 ， 用 户 必 须 通 过 Oracle 提供 的 接口 才能 访问 集 的 内 容 。 
通常 ， 当 用 户 访问 租 套 表 时 ，Oracle 将 整个 集 的 值 一 起 返回 给 用 户 的 客户 进程 。 这 可 能 会 
影响 性 能 ， 因 此 Oracle 支持 返回 一 个 类 似 定 位 颖 的 散 套 表 的 值 ， 就 像 一 个 集 值 的 句柄 。 子 
“AJ RETURN AS LOCATOR 表示 在 检索 时 岩 套 表 将 以 定位 器 的 形式 被 返回 。 如 果 没 有 这 样 指 
明 ， 则 默认 值 是 VALUE， 表 示 必 须 返 回 整 个 散 套 表 ， 而 不 仅 是 散 套 表 的 定位 胡 。 

媒 套 表 与 数组 的 不 同 之 处 在 于 : 

e 数组 有 最 大 长 度 , 但 是 舱 套 表 没有 。 

e 数组 总 是 稠密 的 ,但 栎 套 表 可 能 是 稀 玖 的 ， 因 此 ， 可 以 从 一 个 艇 套 表 删除 单独 存在 
的 一 个 元 素 ， 而 不 可 能 从 一 个 数组 中 删除 这 样 的 一 个 元 素 。 

Oracle 按 顺 序 (在 同一 个 表 空 间 ) 存储 数组 数据 ,但 是 却 以 无 序 方式 将 许 套 表 存 储 在 
存储 表 中 ， 存 储 表 是 一 个 由 系统 产生 的 与 被 散 套 表 相 关 的 数据 库 表 。 
o 当 存 储 到 数据 库 中 时 ， 数 组 维持 其 元 素 的 顺序 和 下 标 ,， 但 是 散 套 表 不 会 维持 。 


9.6.2 ”操作 对 象 表 


本 节 将 以 前 面 创建 的 对 象 为 例 ， 简 要 地 讨论 如 何 操作 对 象 表 。 例 如 ， 可 以 这 样 癌 表 
Staff 中 插入 对 象 : 


INSERT INTO Staff VALUES (‘SG37’, ‘Ann’, ‘Beech’, ‘Assistant’, ‘F’, ‘10-Nov- 
1960’, 12000, NextOfKinNestedType()); 

INSERT INTO Staff VALUES ('SG5’, ‘Susan’, ‘Brand’, ‘Manager’, ‘F’, ‘3-Jun- 
1940’, 24000, NextOfKinNestedType()); 
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表达 式 NextOfKinNestedType ( ) 调用 构造 器 方法 为 这 种 类 型 创建 了 一 个 空 的 属性 
nextOfKin。 可 以 使 用 下 述 语句 向 咀 套 表 中 插入 数据 : 
INSERT INTO TABLE (SELECT s.nextOfKin 
FROM Staff s 
WHERE s:staffNo = ‘SG5’) 
VALUES (‘John’, ‘Brand’, ‘0141-848-2000’); 
该 语句 使 用 了 一 个 TABLE 表达 式 来 标识 插 和 人 操作 的 目标 是 一 个 嵌 套 表 ， 也 就 是 在 Staff 
表 的 行 对 象 的 nextOfKin 列 中 的 俯 套 表 ， 其 staffNo 为 “SG5”。 最 后 ,我们 可 以 向 表 Branch 
中 插入 一 个 对 象 : 
INSERT INTO Branch 
SELECT ‘B003’, AddressType("163 Main St’, ‘Glasgow’, ‘G11 9QX’), REF(s), 
TelNoArrayType(‘0141-339-2178’, ‘0141-339-4439’) 


FROM Staff s 
WHERE s.staffNo = ‘SG5’; 


或 者 可 以 : 


INSERT INTO Branch VALUES (B003', AddressType(‘163 Main St’, ‘Glasgow’, 
‘G11 9QX’), (SELECT REF(s) FROM Staffs WHERE s.staffNo = ‘SG5’), 
TelNoArrayType(‘0 141-339-2178’, ‘0141-339-4439’)); 

查询 对 象 表 。 在 Oracle 中 ， 可 以 用 下 述 查 询 返 回 一 个 有 序 的 分 公司 编号 的 列表 : 


SELECT b.branchNo 
FROM Branch b 
ORDER BY VALUE(b); 


该 查询 隐 式 地 调用 了 比较 方法 getbranchNo， 该 方法 被 定义 为 类 型 BranchType 的 映射 方 
法 ， 用 于 按 branchNo 的 升序 排列 数据 。 可 以 使 用 下 述 查 询 返 回 每 个 分 公司 的 所 有 数据 : 


SELECT b.branchNo, b.address, DEREF(b.manager), b.phoneList 
FROM Branch b 

WHERE b.address.city = ‘Glasgow’ 

ORDER BY VALUE(b); 


注意 用 于 访问 经 理 对 象 的 DEREF 运算 符 的 使 用 。 该 查询 输出 列 branchNo 的 值 、 地 址 
的 所 有 列 、 经 理 对 象 (类 型 为 StaffType) 的 所 有 列 以 及 所 有 相关 的 电话 号 码 。 

可 以 用 下 述 查 询 检索 指定 分 公司 的 所 有 职员 的 家 属 数据 : 

SELECT b.branchNo, b.manager.staffNo, n.* 

FROM Branch b, TABLE(b.manager.nextOfKin) n 

WHERE b.branchNo = ‘B003’; 

许多 应 用 由 于 无 法 处 理 集 类 型 ， 因 此 需要 数据 的 扁平 化 视图 。 本 例 我 们 用 关键 字 
TABLE ik FAR (AERA). Hb, TEMP IAT b.manager.staffNo 是 当 y=DEREF 
(b.manager) 时 y.staffNo 的 一 种 简化 符号 。 


96.3 MRA 


在 4.4 节 和 7.4 节 我 们 已 经 研究 了 视图 的 概念 。 对 象 视图 也 是 一 种 虚 对 象 表 ， 与 视图 这 
种 虚 表 在 很 多 方面 都 非常 相似 。 对 象 视图 允许 为 不 同 的 用 户 定制 数据 。 例 如 ， 我 们 会 创建 一 
个 Staff 表 的 视图 ， 以 防止 某 些 用 户 访问 敏感 的 私人 信息 或 者 与 薪水 有 关 的 信息 。Oracle 创 
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建 的 对 象 视图 不 仅 可 以 限制 对 某 些 数 据 的 访问 ， 而 且 可 以 防止 某 些 方法 (例如 删除 方法 ) 被 
调用 。 也 有 和 争论 认为 ,对象 视图 提供 了 从 纯 关 系 的 应 用 到 面向 对 象 应 用 的 一 条 简便 迁移 途 
径 ， 从 而 方便 各 个 公司 实验 这 项 新 技术 。 

例如 ， 假 定 我 们 已 创建 了 9.6.1 节 和 定义 的 对 象 类 型 ， 并 且 也 已 创建 了 下 面 的 DreamHome 
关系 模式 及 相关 联 的 结构 类 型 BranchType 和 StaffType: 


Branch (branchNo, street, city, postcode, mgrStaffNo) 
Telephone (telNo, branchNo) 
Staff (staffNo, fName, IName, position, sex, DOB, salary, branchNo) 


NextOfKin (staffNo, fName, IName, telNo) 
可 以 利用 对 象 视 图 机 制 创建 一 个 对 象 - 关系 模式 : 


CREATE VIEW StaffView OF StaffType WITH OBJECT IDENTIFIER (staffNo) AS 
SELECT s.staffNo, s.fName, s.IName, s.sex, s.position, s.DOB, s.salary, 
CAST (MULTISET (SELECT n.fName, n.IName, n.telNo 
FROM NextOfKin n WHERE n.staffNo = s.staffNo) 
AS NextOfKinNestedType) AS nextOfkin 
FROM Staff s; 
CREATE VIEW BranchView OF BranchType WITH OBJECT IDENTIFIER 
(branchNo) AS 


SELECT b.branchNo, AddressType(b.street, b.city, b.postcode) AS address, 
MAKE REF(StaffView, b.mgrStaffNo) AS manager, 
CAST (MULTISET (SELECT telNo FROM Telephone t 
WHERE t.branchNo = b.branchNo) AS TelNoArrayType) AS phoneList 
FROM Branch b; 

在 这 两 个 示例 中 ， 表 达 式 CAST/MULTISET 中 的 SELECT TEHN ERR Ne EY 
数据 (在 第 一 个 示例 中 ， 为 员工 家 属 的 列表 ; 在 第 二 个 示例 中 ， 为 分 公司 电话 号 码 的 列表 )。 
关键 字 MULTISET 说 明 这 是 一 个 列表 而 不 是 一 个 单独 的 值 ， 运 算 符 CAST 将 该 列表 转换 为 
所 需要 的 类 型 。 还 要 注意 MAKE REF 运算 符 的 使 用 ，MAKE REF 创建 了 一 个 REF, 或 指 
向 对 象 视图 的 一 行 ， 或 指 问 对 象 标识 符 基于 主 关 键 字 的 对 象 表 中 的 一 行 。 

WITH OBJECT IDENTIFIER 指定 对 象 类 型 的 某 些 属性 ， 它 们 将 被 用 作对 象 视 图 的 关键 
字 。 大 多 数 情况 下 ， 这 些 属性 对 应 着 基本 表 的 主 关 键 字 。 所 指定 属性 的 值 必须 是 唯一 的 ， 而 
且 在 视图 中 能 够 确切 地 标识 每 一 行 。 如 果 对 象 视 图 定义 在 对 象 表 或 者 对 象 视图 上 ， 则 该 子 名 
可 以 被 省 略 ， 或 者 用 WITH OBJECT IDENTIFIER DEFAULT 表示 。 在 每 种 情况 下 ， 都 要 说 
明 相 应 的 基本 表 的 主 关 键 字 ， 以 提供 唯一 性 。 


9.6.4 权限 


Oracle 为 用 户 自 定义 类 型 定义 了 下 列 系统 权限 : 

e CREATE TYPE: 在 用 户 模式 下 创建 用 户 自 定义 类 型 。 

è CREATE ANY TYPE: 在 任意 模式 下 创建 用 户 自 定 义 类 型 。 

e ALTER ANY TYPE: 在 任意 模式 下 修改 用 户 自 定义 类 型 。 

è DROP ANY TYPE: 在 任意 模式 下 删除 已 定义 类 型 。 

© EXECUTE ANY TYPE: 在 任意 模式 下 使 用 和 引用 已 定义 类 型 。 

另外 ，EXECUTE 模式 对 象 权 限 允 许 用 户 使 用 类 型 来 定义 表 、 定 义 关 系 表 中 的 列 、 声 明 
一 个 具名 类 型 的 变量 或 者 参数 ， 以 及 调用 类 型 的 方法 。 
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本 章 小 结 

e 高 级 数据 库 应 用 包括 计算 机 辅助 设计 (CAD)、 计 算 机 辅助 制造 (CAM)、 计 算 机 辅助 软件 工程 
(CASE)、 网 络 管理 系统 、 办 公信 息 系统 (OIS)、 多 媒体 系统 、 数 字 出 版 、 地 理 信息 系统 (GIS)、 交 
互 式 动态 Web 站 点 ， 以 及 具有 复杂 的 、 相 互 关联 的 对 象 和 过 程 性 数据 的 应 用 。 

关系 模型 ， 特 别 是 关系 系统 的 缺点 包括 诸如 对 “现实 世界 ”实体 的 表现 力 不 足 、 语 义 过 载 、 对 完整 
性 和 企业 约束 的 支持 不 足 、 受 限 的 操作 以 及 阻抗 失 配 等 。RDBMS 受 限 的 建 模 能 力 已 经 使 其 无 法 适 
用 于 高 级 数据 库 应 用 。 

扩展 的 关系 数据 模型 并 不 唯一 ， 存 在 许多 不 同 的 扩展 模型 ， 其 特性 取决 于 扩展 的 方式 和 程度 。 不 
过 ， 所 有 的 模型 都 是 基于 基本 的 关系 表 ， 都 使 用 相同 的 查询 语言 ， 所 有 的 模型 都 支持 某 些 “对 象 ” 
的 概念 ， 并 且 部 分 模型 还 具有 将 方法 或 者 过 程 /触发 器 像 数据 一 样 存储 在 数据 库 中 的 能 力 。 

用 于 描述 扩展 的 关系 数据 模型 的 系统 的 术语 多 种 多 样 。 最 早 用 于 描述 这 种 系统 的 术语 是 扩展 的 关系 
DBMS ( Extended Relational DBMS，ERDBMS)， 以 及 术语 通用 服务 器 或 者 通用 DBMS, WIE, A 
们 使 用 了 一 个 更 具 描 述 性 的 术语 一 一 对 象 关系 DBMS ( ORDBMS ) 表示 系统 支持 了 某 些 “对 象 ”的 
概念 。 

H SQL:1999 以 来 ，SQL 标准 扩展 了 如 下 的 对 象 管理 特性 : 行 类 型 、 用 户 自 定义 类 型 (UDT)、 用 户 
自 定义 例 程 (UDR)、 多 态 性 、 继 承 、 引 用 类 型 和 对 象 标识 、 集 类 型 (ARRAY), (879 SQL 计算 完 
备 的 新 的 语言 结构 、 触 发 器 、 对 大 对 象 (包括 进 制 大 对 象 (BLOB) 和 字符 大 对 象 (CLOB)) 的 支持 
以 及 递归 。 


思考 题 


9.1 讨论 高 级 数据 库 应 用 的 一 般 性 特征 。 

9.2 ”讨论 为 什么 关系 数据 模型 和 RDBMS 的 缺点 使 其 无 法 适应 高 级 数据 库 应 用 的 需求 。 
9.3 ”讨论 把 用 面向 对 象 程序 设计 语言 创建 的 对 象 映射 到 关系 数据 库 时 过 到 的 困难 。 
9.4 ORDBMS 提供 了 哪些 典型 的 功能 特性 ? 

9.5 扩展 的 关系 数据 模型 的 优点 和 缺点 是 什么 ? 

9.6 SQL:2011 标准 的 主要 特征 是 什么 ? 

9.7 ”对 引用 类 型 和 对 和 象 标识 的 使 用 方法 进行 讨论 。 

9.8 ”对照 比 较 过 程 、 函 数 和 方法 。 

9.9 什么 是 触发 右 ? 给 出 一 个 触发 器 的 实例 。 

9.10 对 SQL:2011 中 可 用 的 集 类 型 进行 讨论 。 

9.11 引入 用 户 自 定义 的 方法 会 带 来 什么 安全 问题 ? 给 出 这 些 问题 的 解决 方案 。 


习题 

9.12 WR 9.1 节 讨 论 的 高 级 数据 库 应 用 ， 或 者 相似 的 处 理 复杂 的 相关 数据 的 某 个 应 用 。 尤 其 是 要 对 
其 功能 及 其 所 用 的 数据 类 型 和 操作 进行 分 析 ， 并 将 这 些 数 据 类 型 和 操作 映射 到 附录 K 讨论 的 面 
向 对 象 的 概念 上 。 

9.13 分析 你 目前 使 用 的 某 一 RDBMS。 讨 论 该 系统 支持 的 面向 对 象 的 特性 。 这 些 特性 都 提供 了 哪些 
功能 ? 

9.14 分 析 你 目前 使 用 的 各 个 RDBMS。 讨 论 每 个 系统 支持 的 面向 对 象 的 特性 。 这 些 特性 都 提供 了 哪 
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些 功能 ? 
9.15 考虑 第 4 章 习 题 部 分 给 出 的 酒店 案例 的 关系 模式 。 利 用 SQL:2011 的 新 特性 重新 设计 该 模式 。 添 
加 你 认为 适当 的 用 户 自 定义 函数 。 
9.16 ”针对 第 6 章 习题 6.7 一 习题 6.9 的 查询 ， 给 出 SQL:2011 语句 。 
9.17 创建 一 个 insert 触发 怖 ， 建 立 邮 寄 广 告 列 表 ， 它 记录 着 过 去 两 年 元 旦 前 后 一 天 在 该 酒店 和 人 住 的 
所 有 客户 的 姓名 和 地 址 。 
9.18 按照 习题 9.15 的 要 求 ， 重 新 对 第 24 章 习 题 中 的 跨国 工程 模式 进行 分 析 。 
9.19 为 附录 A 的 DreamHome 案例 创建 一 个 对 象 关系 模式 。 添 加 你 认为 合适 的 用 户 自 定义 函数 。 用 
SQL:2011 实现 附录 A 中 列 出 的 查询 。 
9.20 ”为 附录 B.1 的 University Accommodation Office 案例 创建 一 个 对 象 关系 模式 。 添 加 你 认为 合适 的 
用 户 自 定义 函数 。 
9.21 为 附录 B.2 的 EasyDrive School of Motoring 案例 创建 一 个 对 象 关系 模式 。 添 加 你 认为 合适 的 用 
PAE PRL 
9.22 ”为 附录 B.3 的 Wellmeadows 案例 创建 一 个 对 象 - 关系 模式 。 添 加 你 认为 适当 的 用 户 自 定义 函数 。 
9.23 DreamHome 的 常务 董事 要 求 你 调查 并 准备 一 份 关 于 ORDBMS 对 本 公司 的 可 适用 性 的 报告 。 报 
告 应 该 将 RDBMS 和 ORDBMS 的 技术 特性 加 以 对 比 ， 并 且 应 该 就 公司 使 用 ORDBMS 的 优 
缺点 进行 论述 ， 还 应 该 包括 所 有 可 预见 的 问题 。 报 告 还 应 该 考虑 OODBMS 的 可 适用 性 ， 也 
应 该 包括 这 两 类 系统 在 DreamHome 中 的 应 用 的 比较 。 最 后 ， 报 告 应 该 给 出 关于 ORDBMS 在 
DreamHome 的 可 适用 性 的 一 组 完整 且 论 据 充分 的 结论 。 
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| 第 三 部 分 


Database Systems: A Practical Approach to Design, Implementation, and Management, 6E 


数据 库 分 析 与 设计 


第 10 章 ”数据库 系统 开发 生命 周期 

第 11 章 数据 库 分 析 与 DreamHome 案例 研究 
第 12 章 实体 -联系 建 模 

第 13 章 “ 增 强 的 实体 - 联系 建 模 

第 14 章 规范 化 

第 15 章 进一步 规范 化 





Seeded 


Database Systems: A Practical Approach to Design, Implementation, and Management, 6E 


数据 库 系 统 开发 生命 周期 


| 本 章 目标 
本 章 我 们 主要 学 习 : 
e 信息 系统 的 主要 组 成 部 分 
o 数据 库 系 统 开发 生命 周期 (Database System Development LifeCycle, DSDLC) 的 主 
要 阶段 
数据 库 设计 的 主要 阶段 : 概念 设计 、 净 辑 设计 和 物理 设计 
DBMS 的 评估 标准 
如 何 评估 和 选择 DBMS 
使 用 计算 机 辅助 软件 工程 (Computer-Aided Software Engineering, CASE) 工具 的 好 处 


今天 ， 软 件 已 经 取代 硬件 成 为 许多 计算 机 系统 成 功 的 关键 因素 。 遗 憾 的 是 ， 软 件 发 展 
的 历史 进程 并 没有 给 人 留 下 什么 特别 深刻 的 印象 。 过 去 的 几 十 年 中 ， 软 件 规模 不 断 发 生 着 
变化 ， 从 规模 较 小 ， 仅 由 较 少 代码 行 组 成 的 相对 简单 的 应 用 程序 ， 发 展 到 规模 巨大 ， 由 上 
百 万 行 代码 组 成 的 复杂 应 用 程序 。 许 多 大 型 应 用 程序 还 需要 进行 经 常 性 的 维护 ， 包 括 修正 
已 经 发 现 的 错误 ， 实 现 新 的 用 户 需求 ， 修 改 软件 使 其 能 够 在 新 的 或 升级 后 的 平台 上 运行 ， 等 
等 。 由 于 在 软件 维护 上 投入 的 资本 越 来 越 不 堪 重 负 ， 因 而 使 得 许多 大 型 软件 项 目 都 出 现 了 延 
期 交付 、 预 算 超支 、 可 靠 性 低 、 维 护 困 难 和 性 能 低下 等 问题 ， 这 些 情况 的 出 现 直 接 导 致 了 众 
所 周知 的 软件 危机 ( software crisis)。“ 软 件 危机 ”这 一 术语 于 20 世纪 60 年 代 首 次 提出 ， 时 
至 今日 ， 和 危机 仍 未 解除 。 因 此 ， 某 些 作 者 把 软件 危机 称 作 软 件 抑 郁 ( software depression), 
OASIG (一 个 关注 IT 行业 组 织 管理 方面 工作 的 特别 兴趣 小 组 ) 在 英国 进行 的 一 项 关于 软件 
工程 的 研究 表明 危机 仍 存 (OASIG, 1996 ): 

© 80% ~ 90% 的 项 目 没 有 达到 预期 的 性 能 目标 。 
大 约 80% 的 项 目 延 期 交付 并 超过 预算 。 
40% 左右 的 项 目 失 败 或 被 放弃 。 
少 于 40% 的 项 目 强 调 需要 技能 培训 。 
少 于 25% 的 项 目 将 企业 需求 和 技术 完美 结合 。 
仅仅 10% 一 20% 的 项 目 完全 达到 成 功 标 准 。 

导致 软件 项 目 失败 的 主要 原因 包括 : 

© 缺乏 完全 的 需求 说 明 。 

e 缺乏 适合 的 开发 方法 学 。 

e 设计 未 能 很 好 地 分 解 成 易于 管理 的 组 件 。 

为 了 解决 上 述 问 题 ， 人 们 提出 了 一 种 结构 化 的 软件 开发 方法 一 一 信息 系统 生命 周期 
(Information System Lifecycle，ISLC)， 也 称 为 软件 开发 生命 周期 ( Software Development 
Lifecycle，SDLC)。 对 于 数据 库 系 统 来 说 ， 该 生命 周期 特 指 数据 库 系统 开发 生命 周期 


RIO RBEAZRFKAGPABW 231 


(Database System Development Lifecycle, DSDLC). 


| 本章 结构 

10.1 节 简 要 描述 信息 系统 生命 周期 ， 并 讨论 它 与 数据 库 系统 生命 周期 之 间 的 联系 。10.2 
节 概 述 了 数据 库 系统 开发 生命 周期 的 各 个 阶段 。10.3 节 一 10.13 节 详 细 描 述 了 数据 库 系统 开 
发 生命 周期 的 各 个 阶段 。10.14 节 讨 论 了 在 数据 库 系 统 开发 生命 周期 中 CASE 工具 所 提供 的 
支持 。 


10.1 信息 系统 生命 周期 


| 信息 系统 | 在 组 织 机 构 内 用 于 收集 、 管 理 、 控 制 和 分 发 信息 的 一 种 资源 。 


从 20 世 纪 70 年 代 起 ， 数 据 库 系统 已 经 逐渐 代替 了 基于 文件 的 系统 ， 成 为 信息 系统 
(Information System, IS) 的 基础 结构 。 同 时 ， 人 们 还 认识 到 ， 和 其 他 的 资源 一 样 ， 数 据 也 
是 一 种 重要 的 物质 资源 ， 理 应 受到 重视 。 许 多 企业 为 此 建立 了 专门 的 部 门 或 职能 单位 一 一 数 
据 管理 (DA) 和 数据 库 管理 (DBA) 机 构 ， 分 别 负责 管理 、 控 制 数据 和 数据 库 。 

基于 计算 机 的 信息 系统 包括 数据 库 、 数 据 库 软件 、 应 用 软件 、 计 算 机 硬件 ， 还 包括 人 的 
使 用 和 开发 活动 。 

数据 库 是 信息 系统 的 基础 构件 ， 应 该 从 企业 的 需求 这 一 更 加 广泛 的 角度 来 考虑 数据 库 
的 开发 及 使 用 。 因 此 ， 信 息 系统 的 生命 周期 同 支撑 它 的 数据 库 系统 的 生命 周期 之 间 有 着 内 在 
的 联系 。 典 型 的 信息 系统 的 生命 周期 包括 : 规划 、 需 求 收集 与 分 析 、 系 统 设计 、 建 立 原型 系 
统 、 系 统 实现 、 测 试 、 数 据 转换 和 运行 维护 。 本 章 将 从 开发 数据 库 系统 的 角度 来 讨论 这 些 阶 
段 的 工作 。 不 管 怎样 ， 开 发 数据 库 系 统 时 应 该 全 面 考虑 ， 将 其 视 为 开发 大 型 信息 系统 的 一 个 
构件 ， 这 一 点 很 重要 。 

本 章 将 使 用 术语 “职能 部 门 ”和 “应 用 方面 ”表示 企业 内 部 的 特殊 活动 ， 比 如 销售 、 人 
事 和 库存 管理 。 | 


10.2 ”数据 库 系 统 开 发 生命 周期 


数据 库 系 统 是 信息 系统 的 基础 构件 ， 因 此 数据 库 系 统 开 发 生命 周期 与 信息 系统 生命 周期 
之 间 有 着 内 在 的 联系 。 数 据 库 系统 开发 生命 周期 的 各 个 阶段 如 图 10-1 所 示 ， 每 个 阶段 下 面 
的 小 节 编 号 是 本 章 详细 描述 该 阶段 内 容 的 小 节 的 编号 。 

我 们 应 认识 到 数据 库 系统 开发 生命 周期 的 各 个 阶段 并 没有 非常 严格 的 顺序 ， 而 是 通过 
反馈 环 (feedback loop) 在 各 个 阶段 之 间 反 复 迭 代 。 例 如 ， 在 数据 库 设计 时 遇 到 的 问题 ， 可 
能 需要 回 退 到 需求 收集 与 分 析 阶 段 。 几 乎 在 所 有 的 阶段 之 间 都 存在 反馈 环 ， 图 10-1 中 只 显 
示 了 其 中 一 些 比较 明显 的 反馈 环 。 表 10-1 概述 了 数据 库 系统 开发 生命 周期 各 个 阶段 的 主要 
活动 。 

对 于 只 有 少量 用 户 的 小 型 数据 库 系统 来 说 ; 生命 周期 的 活动 并 不 复杂 。 然而， 对 于 一 个 
需要 支持 成 千 上 万 个 用 户 的 数 百 种 查询 和 应 用 的 大 、 中 型 数据 库 系统 来 说 ， 系 统 的 生命 周期 
将 会 变 得 非常 复杂 。 本 章 主 要 关注 与 开发 大 、 中 型 数据 库 系 统 相 关 的 活动 ， 后 续 小 节 将 详细 
叙述 数据 库 系 统 生命 周期 每 一 阶段 的 活动 。 


232 ABD KEFDMA Rt 


oie ib 
r, 






数据 库 设计 
(10.6 节 ) es 





.图 10-1 数据 库 系统 开发 生命 周期 的 各 个 阶段 


表 10-1 数据 库 系统 开发 生命 周期 各 个 阶段 的 主要 活动 


阶 B 主要 活动 
数据 库 规划 规划 如 何 尽 可 能 高 效 和 有 效 地 实现 生命 周期 的 各 个 阶段 
系统 定义 确定 数据 库 系统 的 范围 和 边界 ， 包 括 主要 用 户 的 视图 、 用 户 和 应 用 领域 
需求 收集 与 分 析 收集 与 分 析 数 据 库 系统 的 需求 


数据 库 设 计 完成 数据 库 的 概念 设计 、 逻 辑 设计 和 物理 设计 
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(2) 

阶 B 主要 活动 
DBMS 选 型 选择 一 个 合适 的 DBMS 
应 用 程序 设计 完成 用 户 界面 和 数据 库 应 用 程序 的 总 体 设 计 
建立 原型 系统 (可 选 ) ee shih eh 使 得 设计 人 员 和 用 户 能 够 通过 可 视 化 的 界面 
实现 生成 物理 数据 库 ， 完 成 应 用 程序 的 编码 工作 
数据 转换 与 加 载 将 旧 系 统 中 的 数据 导入 新 系统 ， 若 可 能 ， 则 将 应 用 程序 移植 到 新 的 数据 库 上 运行 
测试 运行 系统 ， 找 出 错误 ， 并 验证 系统 实现 是 否 与 用 户 需 求 一 致 


数据 库 系 统 完 全 实现 后 ， 对 系统 进行 持续 性 的 监控 和 维护 。 必 要 时 ， 重 新 进 


运行 维护 行 生命 周期 各 阶段 的 活动 ， 使 得 系统 能 够 整合 新 的 需求 


10.3 ”数据 库 规划 


数据 库 规划 | 数据 库 规划 是 一 种 管理 活动 ， 目 的 是 尽 可 能 高 效 及 有 效 地 展开 数据 库 系 统 开 
发 生命 周期 的 各 个 阶段 。 


数据 库 规划 必须 与 组 织 机 构 关 于 信息 系统 的 整体 策略 结合 在 一 起 。 构 思 信 息 系统 策略 
时 ， 涉 及 下 面 三 个 主要 问题 : 

e 识别 企业 的 规划 、 目 标 以 及 随 之 而 定 的 信息 系统 需求 。 

e 评估 现 有 的 信息 系统 ， 明 确 其 长 处 与 短处 。 

o 估量 IT 机 遇 可 能 带 来 的 竞争 优势 。 

解决 这 些 问题 的 方法 学 超出 了 本 书 的 讨论 范围 ,， 感 兴趣 的 读者 可 以 参阅 文献 Robson 
( 1997 ) All Codle and Yeates ( 2007 ) 。 

数据 库 规 划 中 重要 的 第 一 步 是 清晰 定义 项 目的 任务 描述 (mission statement), FE FHI 
定义 了 数据 库 系统 的 主要 目标 ， 通 常 由 项 目 主 管 或 负责 人 撰写 。 任 务 描述 有 助 于 明晰 项 目 
目标 ， 找 到 切实 可 行 之 路 ， 从 而 高 效 及 有 效 地 实现 数据 库 系 统 的 设计 开发 。 第 二 步 是 确定 
任务 目标 (mission objective)。 每 个 任务 目标 都 应 当 和 一 个 数据 库 系统 必须 支持 的 功能 相对 
应 。 我 们 假设 如 果 数 据 库 系统 支持 所 有 的 任务 目标 ， 那 么 任务 描述 也 就 实现 了 。 任 务 描述 和 
任务 目标 可 能 还 包括 一 些 额 外 的 信息 ， 通 常 包括 工作 量 、 所 需 资 源 和 资金 。11.4.2 OR 
DreamHome 数据 库 系统 为 例 ， 示 范 如 何 生成 任务 描述 和 任务 目标 。 

数据 库 规划 阶段 还 应 建立 相关 标准 ， 明 确 数据 应 该 如 何 收集 、 确 定数 据 的 格式 、 需 要 什 
么 样 的 文档 以 及 如 何 着 手 进 行 设 计 和 实现 阶段 的 工作 。 标 准 的 建立 和 维护 是 非常 耗 时 的 ， 因 
为 初期 的 建立 和 后 期 的 持续 维护 都 需要 大 量 资源 。 但 设计 良好 的 标准 是 员工 培训 和 质量 控制 
的 基础 ， 可 确保 所 有 工作 都 符合 同一 模式 ， 与 员工 的 技能 和 经 验 无 关 。 例 如 ， 为 了 消除 数据 
元 余 和 数据 不 一 致 ， 我 们 可 以 在 数据 字典 中 定义 数据 项 命名 的 规则 。 任 何 与 数据 相关 的 合理 
的 或 来 自 企 业 的 需求 都 应 记录 在 案 ， 例 如 约束 某 些 类 型 的 数据 应 为 机 密级 的 。 


10.4 ”系统 定义 


| 系统 定义 | 定义 数据 库 应 用 程序 的 范围 和 边界 ， 以 及 主要 的 用 户 视图 。 
在 设计 数据 库 系统 之 前 ， 首 先 应 该 确定 系统 的 边界 ， 定义 数据 库 系统 与 信息 系统 其 他 
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构件 之 间 的 接口 。 在 考虑 系统 边界 时 ， 应 赛 括 未 来 用 户 的 需求 和 应 用 领域 可 能 的 延伸 。 
图 11-10 描述 了 数据 库 系统 DreamHome 的 范围 和 边界 ， 其 中 包括 该 系统 主要 的 用 户 视 图 。 


APRE 


用 户 视 图 | 从 一 个 特定 的 角色 (如 经 理 或 主管 ) 或 者 特定 的 企业 应 用 领域 (如 销售 、 人 事 或 
库存 管理 ) 的 角度 来 定义 数据 库 系统 的 需求 。 


一 个 数据 库 系统 可 能 拥有 一 个 或 多 个 用 户 视图 。 在 需求 收集 分 析 阶 段 ， 用 户 视图 能 够 确 
保 系 统 不 会 遗漏 主要 用 户 的 需求 ， 因 此 确定 用 户 视 图 是 开发 数据 库 系 统 的 重要 组 成 部 分 。 通 
过 对 用 户 视 图 的 分 解 可 以 将 需求 分 解 成 易于 管理 的 部 件 ， 从 而 有 助 于 复杂 数据 库 系统 的 开发 。 

用 户 视图 的 定义 包括 数据 和 处 理 数据 的 事务 〈 换 名 话说 ， 即 用 户 将 会 对 数据 做 些 什么 )。 
用 户 视 图 所 表达 的 需求 之 间 可 能 相互 独立 ， 也 可 能 相互 重 倒 。 包 含 多 个 用 户 视 图 (分 别 标记 
为 用 户 视 图 1 ~ 6) 的 数据 库 系统 如 图 10-2 所 示 。 其 中 ， 用 户 视 图 1、2、3 以 及 用 户 视图 5、 
6 都 有 重合 的 需求 ( 见 阴影 线 区 域 )， 而 用 户 视 图 4 所 表达 的 需求 是 相对 独立 的 。 





图 10-2 包含 多 个 用 户 视图 的 数据 库 系统 : 用 户 视图 1、2、3 和 用 户 视图 5、6 
都 有 重合 的 需求 ( 见 阴影 线 区 域 )， 用 户 视图 4 具有 独立 的 需求 


10.5 ”需求 收集 与 分 析 


需求 收集 与 分 析 | 收集 、 分 析 组 织 机 构 内 需要 数据 库 系统 支持 的 那 部 分 的 信息 ， 并 据 此 确 
定 对 新 系统 的 需求 。 k 


本 阶段 的 活动 主要 涉及 收集 与 分 析 组 织 机 构 内 需要 用 到 数据 库 系 统 的 那 部 分 信息 。 我 们 可 
以 采用 多 种 技术 采集 信息 ， 这 些 技术 被 称 为 实况 发 现 技 术 (fact-finding techniques)， 详 见 第 
11 章 。 针 对 每 个 主要 用 户 视图 ( 指 不 同 的 工作 角色 或 不 同 的 企业 应 用 方面 ) 应 采集 的 信息 包括 : 
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o 使 用 或 产生 的 数据 

e 这 些 数据 是 如 何 使 用 或 产生 的 

© 对 新 数据 库 系统 的 其 他 需求 

通过 对 所 采集 信息 的 分 析 ， 可 以 确定 新 的 数据 库 系 统 的 需求 (或 特性 )， 从 而 生成 新 数 
据 库 系统 的 需求 规格 说 明 书 。 

需求 的 收集 与 分 析 是 数据 库 设 计 的 基础 。 应 收集 的 信息 量 需 要 根据 问题 本 身 的 特性 和 企 
业 的 运转 模式 而 定 。 考 虑 过 细 会 陷 人 分 析 僵 局 (paralysis by analysis)， 无 法 继续 开展 下 一 步 
的 工作 ; 而 考虑 过 粗 则 可 能 因为 针对 错误 的 需求 定位 而 给 出 错误 的 解决 方案 ， 导 致 后 期 不 必 
要 的 时 间 和 人 金钱 浪费 。 

收集 的 信息 可 能 缺乏 良好 的 结构 和 形式 ， 因 此 需要 将 其 转换 为 结构 化 恨 好 的 需求 摘 
述 ， 可 以 采用 的 需求 规范 化 技术 包括 : 结构 化 分 析 和 设计 (Structured Analysis and Design, 
SAD); 数据 流 图 (Data Flow Diagrams, DFD); 带 有 文档 辅助 说 明 的 分 层 输入 处 理 输出 图 
(Hierarchical Input Process Output，HIPO)。 随 后 将 看 到 ， 计算 机 辅助 软件 工程 (CASE) T 
具 能 够 进行 自动 化 的 检测 ， 确 保 需 求 的 完整 性 和 一 致 性 。 在 27.8 节 我 们 还 将 讨论 统一 建 模 
if (Unified Model Language, UML) 对 需求 分 析 与 设计 活动 的 支持 。 

确定 数据 库 系统 的 功能 也 是 本 阶段 的 一 项 关键 性 活动 。 系 统 功 能 的 不 当 (inadequate) 或 
不 完全 (incomplete) 会 使 用 户 感到 使 用 不 便 ， 从 而 导致 系统 利用 率 不 高 ， 其 至 被 弃 而 不 用 。 
然而 功能 过 于 完善 也 会 导致 系统 过 于 复杂 ， 从 而 难于 实现 、 维 护 、 使 用 和 学 习 。 

需求 收集 与 分 析 阶 段 要 解决 的 男 外 一 个 重要 问题 是 如 何 处 理 多 个 用 户 视图 。 通 常 有 三 种 
主要 的 方法 : 

e 集中 式 方法 

e 视图 集成 方法 

© 这 两 种 方法 的 组 合 


10.5.1 集中 式 方 法 


集中 式 方法 | 合并 所 有 用 户 视图 的 需求 ， 形 成 对 新 系统 的 一 组 需求 。 在 数据 库 设 计 阶 段 创 
建 一 个 表示 了 所 有 用 户 需求 的 数据 模型 。 


集中 式 (或 称 one-shot) 方法 将 不 同 用 户 视图 的 需求 汇总 到 一 张 需求 表 中 ， 并 为 这 个 用 户 
视图 的 并 集 命名 以 说 明 它 覆盖 了 所 有 被 归并 用 户 视图 的 应 用 方面 。 在 数据 库 设 计 阶 段 (参见 
10.6 节 ) 建立 的 全 局 数据 模型 ， 即 表示 了 所 有 视图 。 全 局 数据 模型 由 图 和 形式 化 描述 用 户 数 
据 需 求 的 文档 组 成 。 图 10-3 给 出 了 采用 集中 式 方法 处 理 用 户 视图 1, 2. 3 的 示例 。 一 般 来 说 ， 
当 各 用 户 视 图 的 需求 存在 明显 重 芭 并 且 数 据 库 系统 不 是 非常 复杂 时 ， 建 议 采 用 集中 式 方 法 。 


10.5.2 ”视图 集成 方法 
视图 集成 方法 | 每 个 用 户 视图 的 需求 都 独立 列 出 。 在 数据 库 设计 阶段 ， 首 先 针 对 每 个 用 户 
视图 的 需求 建立 各 自 的 数据 模型 ， 然 后 再 加 以 整合 。 


视图 集成 方法 在 需求 收集 与 分 析 阶 段 将 各 个 用 户 视图 的 需求 视 为 相互 独立 的 ， 并 不 加 以 整 
合 ， 而 在 数据 库 设计 阶段 (参见 10.6 节 )， 首 先 为 每 个 用 户 视图 建立 一 个 数据 模型 ， 该 数据 模 
型 仅 对 应 于 一 个 用 户 视图 (或 所 有 用 户 视图 的 一 个 子 集 )， 称 为 局 部 数据 模型 (local data model) 。 
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用 户 
视图 2 
用 户 | i 
ee ee oe 和 所 有 支撑 文档 





全 局 
数据 模型 
10-3 ”采用 集中 式 方法 处 理 多 个 用 户 视图 | 
每 个 局 部 数据 模型 都 由 图 和 形式 化 描述 需求 的 文档 组 成 ， 其 中 ， 需 求 只 是 数据 库 中 一 个 或 多 
个 (而 不 是 全 部 ) 用 户 视图 的 。 在 之 后 的 数据 库 设 计 阶 段 ， 局 部 数据 模型 被 合并 生成 一 个 代表 
所 有 用 户 需求 的 全 局 数据 模型 (global data model), Fl 10-4 给 出 了 使 用 视图 集成 方法 处 理 用 户 
视图 1、2、3 的 示例 。 通 常 ， 当 用 户 视图 之 间 存 在 明显 区 别 并 且 数 据 库 系 统 足 够 复杂 时 ， 可 
以 使 用 这 种 方法 。 事 实证 明 ， 视 图 集成 方法 能 够 分 割 系统 需求 ， 分 割 之 后 更 有 利于 需求 的 收 
集 与 分 析 以 及 后 续 工 作 的 进行 。 在 第 17 章 的 步骤 2.6 中 ， 将 举例 说 明 如 何 使 用 视图 集成 方法 。 






关系 、 数 据 字典 | 
和 所 有 支撑 文档 | 


局 部 数据 模型 
图 10-4 采用 视图 集成 方法 处 理 多 个 用 户 视图 
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对 于 一 些 复杂 的 数据 库 系 统 来 说 ， 更 为 合适 的 方法 也 许 是 两 者 的 结合 ， 即 综合 使 用 集 
中 式 和 视图 集成 式 两 种 方法 来 处 理 多 个 用 户 的 视图 。 例 如 ， 我 们 可 以 首先 使 用 集中 式 的 方法 
将 两 个 或 多 个 用 户 的 视图 汇集 成 一 个 总 的 需求 ， 并 且 将 其 转化 为 局 部 逻辑 数据 模型 ， 然 后 使 
用 视图 集成 化 方法 将 该 局 部 逻辑 数据 模型 与 其 他 的 局 部 逻辑 数据 模型 集成 为 全 局 逻辑 数据 模 
型 。 在 这 种 情况 下 ， 每 一 个 局 部 逻辑 数据 模型 都 对 应 着 部 分 用 户 视图 的 需求 ， 最 终生 成 的 全 
局 逻辑 数据 模型 表达 了 数据 库 系统 所 有 用 户 视 图 的 需求 。 

11.4.4 节 将 详细 讨论 如 何 处 理 多 个 用 户 的 视图 ， 并 将 采用 本 书 描述 的 方法 学 ， 说 明 如 何 
综合 使 用 集中 式 和 视图 集成 式 方法 ， 实 现 DreamHome 房屋 租赁 数据 库 系 统 。 


10.6 ”数据 库 设 计 


数据 库 设 计 | 为 企业 或 单位 所 需 数 据 库 系统 生成 设计 方案 的 过 程 ， 该 设计 方案 应 能 支持 该 
数据 库 的 任务 描述 和 任务 目标 。 


本 方 将 概述 数据 库 设 计 的 主要 方法 ,数据 建 模 在 数据 库 设计 中 的 目的 和 用 法 ， 以 及 数据 
库 设计 的 三 个 阶段 一 一 概念 数据 库 设计 、 逻 辑 数 据 库 设计 和 物理 数据 库 设计 。 


10.6.1 数据 库 设计 方法 


数据 库 设 计 可 以 采用 的 方法 主要 有 两 种 :“ 自 下 而 上 ”(bottom-up) 和 “ 自 上 而 下 ”(top- 
down)。 自 下 而 上 方法 从 底层 的 属性 ( 指 实体 和 联系 的 属性 ) 入 手 ， 通 过 分 析 属 性 之 间 的 关 
联 ， 将 它们 分 别 组 合成 代表 实体 类 型 和 实体 类 型 之 间 联 系 的 关系 。 在 第 14、15 两 章 中 ， 我 
们 将 讨论 规范 化 过 程 ， 该 过 程 代表 了 一 种 数据 库 设 计 中 的 目下 而 上 的 方法 。 规 范 化 时 ， 首 先 
确定 所 需 属 性 ， 然 后 基于 属性 之 间 的 函数 依赖 将 属性 聚集 成 规范 化 的 关系 。 

自 下 而 上 的 方法 适用 于 涉及 属性 相对 较 少 的 简单 数据 库 的 设计 。 对 于 包含 了 大 量 属性 的 
复杂 数据 库 来 说 ， 由 于 很 难 完 全 建立 起 所 有 属性 之 间 的 函数 依赖 ， 也 就 很 难 根据 属性 生成 规 
范 化 的 关系 ， 因 此 自 下 而 上 的 方法 不 再 适用 。 复 杂 数 据 库 的 概念 数据 模型 和 逻辑 数据 模型 可 
能 包含 成 百 上 千 个 属性 ， 因 此 需要 一 种 能 够 简化 设计 过 程 的 方法 。 而 且 ， 对 于 复杂 数据 库 来 
说 ， 在 定义 数据 需求 的 初始 阶段 ， 很 难 马 上 确定 所 有 的 属性 。 

对 于 复杂 数据 库 ， 一 种 更 佳 的 策略 是 采用 自 上 而 下 的 方法 : 建 模 初始 ， 数 据 模 型 仅 包 
含 少量 的 高 层 实体 以 及 实体 之 间 的 联系 ， 然 后 连续 使 用 和 目 上 而 下 的 方法 精 化 模型 ， 进 一 步 确 
定 低层 的 实体 、 实 体 之 间 的 联系 以 及 相关 属性 。 我 们 可 以 使 用 实体 -KR ( Entity-Relation, 
ER) 模型 的 概念 来 说 明 自 上 而 下 的 方法 。 实 体 联系 模型 首先 确定 数据 库 系 统 所 包含 的 实体 和 
实体 之 间 的 联系 。 例 如 ， 在 DreamHome 的 示例 中 ， 我 们 可 以 首先 建立 实体 PrivateOwner 和 
PropertyForRent， 然 后 确定 这 两 个 实体 之 间 的 联系 PrivateOwner Owns PropertyForRent， 最 
后 提取 这 两 个 实体 所 包括 的 属性 (这 里 仅 列 出 部 分 属性 ) PrivateOwner 包含 了 ownerNo、 
name 和 address 三 个 属性 ，PropertyForRent 则 拥有 propertyNo 和 address 两 个 属性 。 在 第 
12 章 和 第 13 章 中 将 详细 讨论 如 何 使 用 ER 模型 建立 高 层 数据 模型 。 

除 此 之 外 ， 数 据 库 设计 方法 还 包括 由 里 向 外 (inside-out) 以 及 多 种 方法 相 结合 的 混合 策略 。 
由 里 向 外 的 设计 方法 与 自 下 而 上 方法 类 似 ， 区 别 在 于 : 由 里 向 外 首先 建立 主要 实体 的 集合 ， 
然后 向 外 扩展 ， 确 定 与 已 建立 实体 相关 的 其 他 实体 、 联 系 和 属性 。 混 合 策略 则 将 数据 模型 分 

割 为 可 组 装 的 构件 ， 对 不 同 的 构件 既 可 以 使 用 自 下 而 上 的 方法 也 可 以 选择 和 目 上 而 下 的 方法 。 
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10.6.2 ”数据 建 模 


数据 建 模 的 目的 主要 有 两 个 ， 一 是 有 助 于 设计 人 员 对 数据 含义 〈 语 义 ) 的 理解 ， 二 是 有 
助 于 设计 人 员 与 用 户 之 间 的 交流 。 数 据 建 模 要 求 回 答 关 于 实体 、 联 系 、 属 性 的 问题 。 为 此 ， 
设计 人 员 需 要 找 出 企业 数据 的 原本 的 语义 ， 无 论 它们 是 否 出 现在 形式 化 的 数据 模型 中 。 实 
体 、 联 系 和 属性 是 描述 企业 信息 的 基石 ， 但 是 对 设计 人 员 来 说 可 能 一 直 很 难 理解 它们 的 含 
义 ， 直 到 它们 被 正确 地 记录 在 文档 中 。 数 据 模型 有 助 于 我 们 对 数据 含义 的 理解 ， 因 此 通过 数 
据 建 模 可 以 确保 我 们 能 够 正确 理解 : 

e 每 个 用 户 对 数据 的 观点 

e 与 其 物理 表现 形式 无 关 的 数据 本 身 的 性 质 

e 各 用 户 视 图 中 数据 的 使 用 

数据 模型 可 以 用 来 表达 设计 人 员 对 企业 信息 需求 的 理解 ， 如 果 双 方 都 熟悉 模型 中 使 用 
的 符号 ， 数 据 模型 就 可 以 帮助 用 户 和 设计 人 员 进 行 交 流 。 企 业 也 在 逐步 规范 着 建 模 数据 的 方 
式 : 选择 一 种 特定 的 数据 建 模 方法 并 且 贯 穿 整个 数据 库 项 目的 开发 过 程 。 数 据 库 设计 中 最 篆 
用 的 ， 即 本 书 采 用 的 高 层 数据 模型 是 ER 模型 ( 详 见 第 12 章 和 第 13 章 )。 
数据 模型 的 标准 

一 个 理想 的 数据 模型 应 符合 表 10-2 所 列 的 标准 (Fleming and Von Halle，1989 )。 但 是 ， 
有 时 这 些 标 准 互相 矛盾 ， 需 要 进行 折 中 。 例 如 ， 在 试图 追求 更 好 的 表现 力 时 ， 数 据 模 型 就 会 
失去 简洁 性 。 


表 10-2 建立 理想 数据 模型 的 标准 


结构 有 效 性 与 企业 定义 和 组 织 信 息 的 方式 一 致 

简洁 性 容易 被 信息 系统 领域 的 专业 人 员 或 非 专业 人 员 (用 户 ) 理解 
表现 力 能 够 区 别 不 同 的 数据 ， 以 及 数据 之 间 的 联系 和 约束 

没有 元 余 排除 无 关 信 息 ， 特 别 是 不 重复 表达 信息 

REE ， 并 不 限于 特定 的 应 用 或 技术 ， 因 此 可 广泛 使 用 

可 扩展 性 可 以 扩展 支持 新 的 需求 ， 并 且 尽 可 能 不 影响 现 有 用 户 的 使 用 
完整 性 与 企业 使 用 和 管理 信息 的 方式 一 致 

图 表 化 表示 能 够 用 易于 理解 的 图 表 符号 表示 模型 


10.6.3 ”数据 库 设 计 的 阶段 划分 

数据 库 设 计 分 为 概念 设计 、 逻 辑 设计 和 物理 设计 三 个 阶段 。 
概念 数据 库 设 计 
| 概念 数据 库 设计 | 建立 概念 数据 模型 的 过 程 ， 该 模型 与 所 有 物理 因素 无 关 。 

数据 库 设计 的 第 一 阶段 称 为 概念 数据 库 设 计 。 在 这 一 阶段 ， 将 根据 用 户 需求 规格 说 明 书 
建立 概念 数据 模型 。 在 概念 数据 库 设 计 阶 段 ， 无 需 考 虑 实现 细节 ， 即 概念 模型 不 涉及 类 似 目 
标 DBMS 软件 的 选择 、 应 用 程序 的 编制 、 编 程 语言 的 选择 、 硬 件 平台 的 选择 或 其 他 任何 物 
理 实现 上 的 细节 问题 。 第 16 音 将 逐步 具体 说 明 如 何 进行 概念 数据 库 设计 。 

在 建立 概念 数据 模型 的 整个 过 程 中 ， 模 型 被 不 断 测试 、 修 改 直至 满足 用 户 的 需求 。 概 念 
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数据 模型 是 基础 ， 是 下 一 阶段 一 一 逻辑 数据 库 设计 的 信息 来 源 。 
逻辑 数据 库 设计 


逻辑 数据 库 设 计 | 根据 已 有 的 概念 数据 模型 ， 建 立 逻 辑 数据 模型 ， 该 模型 与 具体 的 DBMS 
以 及 其 他 物理 因素 无 关 。 


数据 库 设计 的 第 二 阶段 称 为 逻辑 数据 库 设 计 ， 在 这 一 阶段 ， 针 对 建 模 时 关注 的 企 事业 
部 分 构建 逻辑 数据 模型 。 即 将 前 一 阶段 创建 的 概念 数据 模型 进行 精 化 ， 然 后 映射 为 逻辑 数据 
模型 。 逻 辑 数据 模型 是 建立 在 目标 数据 库 所 支持 的 数据 模型 (例如 ， 关 系数 据 模 型 ) 基础 之 
上 的 。 

尽管 概念 数据 模型 独立 于 物理 实现 ， 但 是 逻辑 数据 模型 却 是 在 已 知 目标 DBMS 的 基 
本 数据 模型 的 条 件 下 推导 出 来 的 。 也 就 是 说 ， 进 行 逻 辑 数据 库 设计 时 ， 我 们 需要 知道 目标 
DBMS 是 关系 的 、 网 状 的 、 层 次 的 还 是 面向 对 象 的 。 除 此 之 外 ， 将 忽略 所 选 DBMS 的 其 他 
特征 ， 尤 其 是 物理 细节 ， 如 目标 DBMS 支持 的 存储 结构 或 者 索引 ， 等 等 。 

在 建立 逻辑 数据 模型 的 整个 过 程 中 ， 也 将 不 断 地 对 模型 进行 测试 、 修 改 直 至 满足 用 户 的 
需求 。 在 这 一 阶段 ， 我 们 引入 规范 化 技术 来 验证 逻辑 数据 模型 的 正确 性 。 规 范 化 可 以 保证 由 
数据 模型 导出 的 关系 没有 数据 元 余 ， 而 数据 元 余 则 可 能 会 引起 更 新 异常 。 第 14 章 将 指出 数据 
宛 余 带 来 的 问题 ， 并 详 述 规范 化 过 程 。 另 外 ， 逻 辑 数 据 模型 还 应 完全 支持 由 用 户 说 明 的 事务 。 

逻辑 数据 模型 又 是 下 一 阶段 的 信息 来 源 ， 为 物理 数据 库 设计 人 员 进 行 权衡 考虑 提供 了 便利 ， 
权衡 考虑 对 有 效 的 数据 库 设 计 是 十 分 重要 的 。 逻 辑 数据 模型 在 数据 库 系统 开发 生命 周期 的 运行 
维护 阶段 也 担当 着 重要 的 角色 。 对 数据 模型 的 正确 维护 和 及 时 更 新 能 够 使 数据 库 很 好 地 适应 
未 来 的 变化 ， 使 得 以 后 对 应 用 程序 和 数据 的 修改 都 能 够 在 数据 库 中 得 到 正确 而 有 效 的 体现 。 

第 17 章 将 逐步 具体 说 明 如 何 进 行 概念 数据 库 设 计 。 
物理 数据 库 设 计 
物理 数据 库 设计 | 产生 数据 库 在 辅 存 上 的 实现 描述 的 过 程 。 物 理 数据 库 设 计 定 义 了 基础 关 

系 、 文 件 组 织 方式 和 能 够 提高 数据 访问 效率 的 索引 ， 以 及 所 有 的 完整 性 约束 和 安全 措施 。 


物理 数据 库 设 计 是 数据 库 设 计 的 最 后 一 个 阶段 。 在 这 一 阶段 ， 设 计 人 员 将 确定 数据 库 的 
物理 实现 细节 。 在 逻辑 数据 库 设 计 阶 段 (物理 数据 库 设计 的 前 一 阶段 ) 已 经 建立 了 数据 库 的 
逻辑 结构 ， 实 现 了 关系 和 业务 约束 的 定义 。 尽 管 逻辑 结构 的 设计 与 DBMS 的 选择 无 关 ， 但 
逻辑 数据 模型 的 选择 需要 与 目标 DBMS 支持 的 数据 模型 一 致 ， 如 关系 模型 、 网 状 模 型 或 者 
层次 模型 。 在 物理 数据 库 设计 阶段 ， 必 须 首 先 明确 目标 DBMS， 因 此 物理 数据 库 设计 是 面向 
特定 的 DBMS 系统 的 。 在 这 一 阶段 ， 为 了 提高 性 能 而 做 出 的 一 些 决 策 可 能 会 影响 逻辑 数据 
模型 的 数据 结构 的 设计 ， 因 此 在 物理 数据 库 设 计 和 逻辑 数据 库 设 计 之 间 存 在 迭 代 。 

通常 ， 物 理 数据 库 设 计 的 主要 目标 就 是 描述 如 何 物理 地 实现 逻辑 数据 库 的 设计 。 对 于 关 
系 模型 ， 物 理 数 据 库 设计 活动 包括 : 

© 根据 逻辑 数据 模型 ， 物 理 地 创建 关系 表 和 完整 性 约束 。 

© 确定 数据 的 存储 结构 和 访问 方式 ， 确 保 数 据 库 系 统 的 性 能 最 优 。 

© 设计 安全 保护 机 制 。 

对 于 大 型 系统 ， 理 想 情况 是 将 概念 和 逻辑 数据 库 设计 同 物 理 数 据 库 设 计 分 离开 来 ， 主 要 
有 三 个 原因 : 
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e 设计 的 内 容 不 同 : 前 者 仅 涉 及 做 什么 ， 与 怎么 做 无 关 。 

e 执行 的 时 机 不 同 : 在 决定 怎么 做 之 前 必须 先 明 确 做 什么 。 

e 需要 的 技术 不 同 : 不 同 阶段 的 建 模 技 术 经 常 为 不 同 的 人 所 拥有 。 

数据 库 设计 是 一 个 反复 迭代 的 过 程 ， 虽然 有 一 个 起 点 , 但 精 化 的 过 程 却 几 乎 没有 终点 。 
精 化 应 当 被 看 作 学 习 过 程 。 随 着 设计 人 员 对 企业 运作 和 数据 含义 的 进一步 理解 ， 新 的 信息 将 
被 反映 在 数据 模型 中 ， 这 种 改变 也 会 引起 对 模型 其 他 部 分 的 修改 。 特 别 是 ， 概 念 数 据 库 设计 
和 逻辑 数据 库 设 计 是 一 个 系统 能 否 成 功 的 决定 性 因素 ， 如果 设 计 不 是 企业 的 真实 表示 ， 那 么 
将 很 难 定义 出 所 有 要 求 的 用 户 视 图 ， 也 很 难 维护 数据 库 的 完整 性 。 同 样 可 以 证 明 ， 定 义 数据 
” 库 的 物理 实现 和 维持 可 接受 的 系统 性 能 也 会 很 困 
难 。 男 一 方面 ， 好 的 数据 库 设计 应 该 能 够 根据 需 
求 变 化 做 出 相应 的 调整 ， 这 也 是 好 的 数据 库 设计 
的 一 个 标志 。 因 此 ， 为 了 得 到 一 个 尽 可 能 好 的 数 
据 库 设计 方案 ， 花 费 必要 的 时 间 和 精力 是 值得 的 。 

在 第 2 章 中 ,我 们 讨论 了 数据 库 系 统 的 三 层 
ANSI-SPARC 体系 结构 : 外 模式 、 概 念 模式 和 内 
模式 。 图 10-5 给 出 了 三 级 模式 与 概念 、 逻 辑 和 物 
理 数 据 库 设 计 阶 段 的 对 应 关系 。 第 18、19 章 中 
将 逐步 详细 描述 物理 数据 库 设 计 阶 段 所 涉及 的 方 


法 学 。 


10.7 DBMS 选 型 







逻辑 /概念 数据 库 设 计 


物理 数据 库 设计 


图 10-5 数据 建 模 与 ANSI-SPARC 体系 结构 


| DBMS 选 型 | 选择 适合 的 DBMS 以 支持 相应 的 数据 库 系 统 。 


如 果 系 统 开发 之 初 并 未 指定 DBMS， 那 么 DBMS 选 型 比较 适宜 的 时 机 是 在 概念 数据 库 
设计 之 后 ， 且 在 逻辑 数据 库 设 计 之 前 ( 见 图 10-1 )。 然 而 ， 如 果 已 经 收集 到 足够 多 的 与 系 
统 需求 相关 的 信息 ， 如 系统 性 能 、 数 据 库 的 易 重 组 性 、 安 全 性 和 完整 性 约束 等 需求 ， 那 么 
DBMS 的 选 型 可 以 在 逻辑 数据 库 设 计 之 前 的 任何 时 间 进 行 。 

尽管 我 们 可 能 不 会 频繁 地 进行 DBMS 的 选 型 ， 但 是 当 企 业 的 需求 扩展 或 者 需要 重建 现 
有 系统 时 ， 将 有 必要 再 次 对 DBMS 产品 进行 评估 ， 所 选 DBMS 既 要 满足 企业 眼下 所 需 也 要 
兼顾 未 来 需求 的 扩展 ， 选 型 时 要 在 各 种 成 本 之 间 做 出 权衡 ， 这 些 成 本 包括 : 购买 DBMS 产 
品 的 费用 、 相 关 软 硬件 的 开销 、 系 统 重 建 相 关 的 费用 以 及 员工 培训 的 开销 。 

选 型 时 ， 我 们 可 以 简单 地 将 DBMS 的 特性 与 系统 需求 加 以 比较 ， 选 型 过 程 应 确保 计划 
周密 ， 并 且 所 选 DBMS 要 能 真正 让 企业 受益 。 在 下 一 节 中 将 描述 一 种 选择 “最 适宜 ”DBMS 
的 典型 方法 。 

K 10-3 列 出 了 DBMS 选 型 过 程 的 主要 步骤 。 
确定 DBMS 选 型 时 研究 考虑 的 方面 表 10-3 DBMS 选 型 的 主要 步骤 

列 出 DBMS 选 型 时 研究 考虑 的 方面 ， 包 括 说 明 调 研 确定 研究 考虑 的 方面 
的 目标 、 范 围 和 需要 完成 的 任务 。 该 文档 还 可 以 包括 评 ”和 列 出 两 到 三 个 候选 DBMS 产品 
估 DBMS 产品 时 所 需 的 选 型 准则 (基于 用 户 需 求 规格 说 ”评估 这 些 候选 产品 
明 书 )、 初 步 生 成 的 选 型 列表 、 所 有 必要 的 约束 条 件 和 选 ” SRE 
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型 进度 表 ， 等 等 。 
列 出 两 到 三 个 候选 DBMS 产品 

那些 被 认为 是 成 事 “ 关 键 ” 的 准则 可 用 于 筛选 出 DBMS 候选 产品 列表 ， 以 供 后 期 评估 
使 用 。 例 如 ， 是 否 考虑 某 一 DBMS 依赖 于 系统 开发 预算 、 开 发 商 的 技术 支持 的 程度 、 与 其 
他 软件 的 兼容 性 、 有 无 特殊 的 硬件 文 撑 环 境 要 求 ， 等 等 。 另 外 ， 通 过 接触 该 产品 已 有 用 户 ， 
还 可 以 收集 到 额外 的 有 用 信息 :供应 商 实际 的 技术 支持 能 力 ， 该 产品 如 何 支 持 特 殊 的 应 用 ， 
是 否 在 某 些 硬件 平台 上 运行 会 比 在 其 他 平台 上 运行 产生 更 多 的 问题 。 还 可 以 参考 基准 测试 
(benchmark) 结果 对 DBMS 产品 进行 性 能 比较 。 经 过 对 DBMS 产品 的 功能 和 特性 的 初步 调 
研 后 ， 可 以 确定 两 到 三 个 候选 DBMS. 

万 维 网 (World Wide Web) 是 一 个 非常 好 的 信息 资源 ， 可 以 利用 万 维 网 甄选 潜在 的 候选 
DBMS。 例 如 ，DBMS 杂志 的 网 站 ( www.intelligententerprise.com) 提供 了 一 个 关于 DBMS 
产品 的 综合 索引 。 产 品 供应 商 的 网 站 也 会 提供 关于 DBMS 产品 的 有 用 信息 。 
评估 候选 DBMS 产品 

评估 DBMS 产品 的 指标 很 多 。 出 于 不 同 评估 目的 考虑 ， 可 以 将 多 个 性 能 参数 成 组 评估 
(例如 ， 对 数据 定义 指标 组 综合 评估 )， 或 者 单独 考察 (例如 ， 仅 对 数据 定义 指标 组 中 的 有 效 
数据 类 型 特性 进行 评估 )。 表 10-4 将 评估 DBMS 产品 的 指标 分 为 以 下 几 组 : 数据 定义 、 物 
理 定义 、 可 访问 性 、 事 务 处 理 、 实 用 工具 、 应 用 开发 和 其 他 。 


表 10-4 评估 DBMS 的 指标 


数据 定义 物理 定义 
强制 定义 主 关 键 字 可 用 文件 结构 
外 部 关键 字 规 范 文件 结构 维护 
可 用 的 数据 类 型 易 重 组 性 
数据 类 型 的 可 扩展 性 索引 
域 说 明 变 长 字段 /记录 
易于 重 构 数据 压缩 
完整 性 控制 加 密 程 序 
视图 机 制 内 存 需 求 
数据 字典 存储 需求 
数据 独立 性 
基本 数据 模型 
模式 演化 
可 访问 性 事务 处 理 
支持 多 种 查询 语言 : 遵从 SQL2/SQL:2011/ODMG nk ea 
提供 3GL 接口 日 志 机 制 
支持 多 用 户 并 发 粒度 
安全 性 死 锁 解决 策略 
-访问 控制 高 级 事务 模型 


- 授权 机 制 并 行 查询 处 理 
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实用 工具 
性 能 监测 
调 优 
数据 导入 / 导出 
用 户 监视 
数据 库 管 理 支持 
x ft 
可 升级 性 
厂商 稳定 性 
用 户 基 础 
培训 和 用 户 支 持 
文档 
要 求 的 操作 系统 
价格 
在 线 帮助 
所 用 标准 
版 本 管理 
可 扩展 的 查询 优化 
可 伸缩 性 
对 报表 和 分 析 工 具 的 支持 


应 用 开发 
4GL/5GL 工具 
CASE 工具 
图 形 化 操作 界面 (Windows 能 力 ) 
存储 过 程 、 触 发 器 和 规则 
Web 开发 工具 


与 其 他 DBMS 和 系统 的 互 操 作 性 
Web 集成 

数据 复制 工具 

分 布 式 能 力 

可 移植 性 

要 求 的 硬件 

网 络 支 持 

面向 对 象 的 能 力 


( 续 ) 


体系 结构 (支持 二 或 三 层 客户 / 服务 器 模式 ) 


性 能 

事务 吞吐 量 

最 大 用 户 并 发 数 

对 XML 和 Web 服务 的 支持 


表 10-5 “用 于 DBMS 产品 评估 的 指标 分 析 实 例 


DBMS: 某 产 品 
厂商 : 某 厂 商 
物理 定义 组 

指 标 
可 用 文人 结构 ë ane | 8 |  o5 
smene [enamn Jo 6 | 0 | 
ss re eee Se 
wi Pag a 


Tr |e es E 


如 果 对 这 些 指 标 只 是 简单 地 用 好 或 是 不 好 来 进行 评价 ， 那 么 很 难 在 DBMS 产品 之 间 进 行 
比较 。 一 个 更 加 实用 的 方法 是 : 根据 这 些 指标 或 指标 组 在 系统 中 的 重要 性 ， 将 其 赋予 不 同 的 
权重 ， 用 最 后 得 到 的 综合 权 值 来 比较 。 表 10-5 显示 了 如 何 使 用 这 种 方法 对 某 DBMS 产品 的 
物理 定义 指标 组 进行 分 析 。 首 先 评估 每 个 指标 的 等 级 值 ， 用 一 个 不 超过 10 的 数 表示 ， 每 个 指 
标 在 组 内 都 有 一 个 用 小 于 1 的 数 表示 的 权重 ， 表 示 相 对 于 同 组 其 他 指标 的 重要 性 。 计 算 该 指 
标的 最 后 得 分 需要 将 其 等 级 与 权重 相 乘 。 例 如 ， 表 10-5 中 ,“ 易 重组 性 ”的 等 级 是 4， 权 重 
为 0.25， 评 估 得 分 是 1.0。 在 表 10-5 中 ， 该 指标 权重 最 高 ， 说 明 在 此 次 评估 中 它 是 最 重要 的 因 
素 。“ 易 重组 性 ”的 权重 是 “数据 压缩 ”的 5 倍 , “数据 压 缩 ” 的 权重 最 低 ， 仅 为 0.05。 而 “内 
存 需 求 ” 和 “存储 需求 ”的 权重 都 是 0.00, 说 明 在 评估 时 根本 不 考虑 这 些 指标 对 系统 的 影响 。 
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将 各 指标 评估 后 的 得 分 加 在 一 起 ， 就 得 到 该 组 的 得 分 。 而 该 组 又 有 一 个 权重 ， 用 来 表示 
在 此 次 评估 中 该 组 相对 于 其 他 指标 组 的 重要 性 。 例 如 ， 在 表 10-5 中 ， 物 理 定 义 组 的 总 分 是 
5.75， 而 5.75 的 权重 为 0.25。 

最 后 ， 将 所 有 评估 指标 组 加 权 后 的 得 分 加 在 一 起 就 得 到 了 某 DBMS 产品 的 得 分 。 将 不 
E] DBMS 的 最 后 评估 得 分 进行 比较 ， 分 数 最 高 的 产品 就 是 最 佳 选 择 。 

除 此 之 外 ， 我 们 还 可 以 采取 由 DBMS 厂商 演示 其 产品 或 者 对 该 产品 进行 内 部 (in-house) 
测试 的 方法 来 进行 评估 。 采 用 内 部 评测 时 ， 需 为 候选 DBMS 搭建 测试 平台 。 测 试 每 个 候选 
产品 满足 用 户 提出 的 数据 库 系 统 需求 的 程度 。 在 www.tpc.org 上 可 以 找到 由 事务 处 理 委员 会 
(Transaction Processing Council) 公布 的 基准 测试 报告 。 


给 出 建议 选 型 DBMS 的 报告 
数据 库 选 型 的 最 后 一 步 是 记录 下 整个 选 型 过 程 ， 并 提供 一 份 最 后 结果 的 说 明和 建议 选择 
的 DBMS 产品 。 


10.8 “应 用 程序 设计 


| 应 用 程序 设计 | 完成 用 户 界 面 和 使 用 、 处 理 数据 库 的 应 用 程序 的 总 体 设 计 。 


在 图 10-1 中 ， 可 以 看 到 在 数据 库 系 统 开发 生命 周期 中 数据 库 设 计 和 应 用 程序 设计 是 并 
行进 行 的 。 大 多 数 情况 下 ， 不 可 能 在 数据 库 设 计 实 现 之 前 就 完成 应 用 程序 的 设计 。 另 一 方 
面 ， 数 据 库 是 应 用 程序 设计 的 支撑 ， 因 此 ， 应 用 程序 设计 和 数据 库 设 计 之 间 必 然 存在 信息 
交流 。 

我 们 必须 确保 用 户 需 求 规格 说 明 书 中 提 到 的 所 有 功能 都 要 在 数据 库 系统 的 应 用 程序 设计 
中 体现 出 来 ， 这 将 涉及 到 访问 数据 库 的 应 用 程序 的 设计 和 数据 库 事务 的 设计 〈 即 数据 库 访问 
方式 )。 除 了 设计 如 何 实现 需求 的 功能 外 ， 还 应 为 数据 库 系统 设计 一 个 合适 的 用 户 界 面 。 用 
户 界面 应 该 以 用 户 友好 的 方式 提供 信息 。 用 户 界面 设计 的 重要 性 常常 被 忽略 ， 或 者 直到 设计 
阶段 的 后 期 才 着 手 考虑 。 然 而 ， 我 们 应 该 认识 到 界面 可 能 是 系统 最 重要 的 组 件 之 一 。 如 采 界 
面容 易学 习 、 易 于 使 用 、 简 单 明 了 、 容 错 性 强 ， 则 用 户 就 能 更 好 地 利用 系统 提供 的 信息 。 相 
反 ， 如 果 界 面 完 全 不 具备 上 述 特点 ， 则 毫 无 疑问 ， 用 户 在 使 用 该 系统 时 一 定 会 遇 到 麻烦 。 

下 面 将 简要 介绍 一 下 应 用 程序 设计 两 个 方面 的 问题 : 事务 设计 和 用 户 界 面 设计 。 


10.8.1 事务 设计 
在 讨论 事务 设计 之 前 我 们 先 描述 一 下 事务 的 含义 。 
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| 事务 | 由 单个 用 户 或 应 用 程序 执行 的 访问 或 修改 数据 库 的 一 个 或 一 组 动作 。 


事务 是 “现实 世界 ”中 事件 的 表示 ， 例 如 ， 登 记 待 出 租 的 房屋 、 增 加 一 名 新 员工 、 注 
册 一 名 新 客户 或 出 租 一 处 房屋 。 运 用 事务 能 够 确保 数据 库 中 的 数据 同 现实 世界 的 情况 保持 一 
致 ， 并 能 够 提供 用 户 所 需 信息 。 
一 个 事务 可 能 由 几 个 操作 组 成 ， 如 资金 转账 就 是 由 几 个 操作 组 成 的 。 然 而 ， 从 用 户 的 
角度 来 看 ， 这 些 操 作 不 过 是 完成 了 一 个 任务 。 从 DBMS 的 角度 来 看 ， 事 务 将 数据 库 从 一 个 
一 致 状态 转换 到 另 一 个 一 致 状态 。DBMS 应 保证 数据 库 的 一 致 性 ， 即 使 出 现 故 障 也 应 如 此 。 
DBMS 还 应 保证 一 旦 某 个 事务 完成 ， 事 务 的 操作 结果 将 永久 地 保存 在 数据 库 中 ， 不 会 丢失 
或 回 退 (执行 另 一 事务 来 替换 第 一 个 事务 操作 的 效果 )。 如 果 由 于 某 种 原因 事务 不 能 完成 ， 
DBMS 要 保证 能 够 回 退 该 事务 所 做 的 任何 操作 ， 消 除 其 对 数据 库 的 影响 。 在 银行 交易 中 ， 如 
果 资 金 已 从 贷方 账户 贷 出 ， 但 在 尚未 划 入 借方 账户 前 这 个 事务 失败 了 , 那么 DBMS 将 撤销 
这 次 交易 。 如 果 将 贷方 贷 出 与 借方 借 人 操作 定义 为 两 个 单独 的 事务 ， 那 么 一 旦 贷方 事务 完 
成 ， 则 不 允许 撤销 该 变更 〈 即 使 此 时 并 未 执行 另 一 事务 借 人 贷 出 的 金额 )。 
事务 设计 的 目的 是 把 数据 库 所 需 事 务 的 高 层 特性 确定 下 来 并 形成 文档 。 这 些 特 性 包括 : 
事务 用 到 的 数据 
事务 的 功能 特性 
e 事务 的 输出 
e 对 于 用 户 的 重要 性 
© 预期 的 使 用 率 
事务 设计 应 该 在 应 用 程序 设计 阶段 的 前 期 进行 ， 以 确保 数据 库 能 够 支持 所 有 系统 涉及 的 
事务 处 理 。 事 务 主要 分 为 以 下 三 类 : 检索 型 事务 、 更 新 型 事务 和 混合 型 事务 。 
。 检索 型 事务 。 检 索 型 事务 主要 用 于 数据 检索 ， 并 将 这 些 数据 显示 在 屏幕 上 或 生成 报 
表 。 例 如 ， 查 询 并 显示 某 一 指定 编号 的 房屋 的 详细 信息 。 

e 更 新 型 事务 。 更 新 型 事务 用 于 实现 记录 的 插入 、 删 除 或 修改 。 例 如 ， 在 数据 库 中 插 
入 某 一 新 的 房屋 的 信息 。 

e 混合 型 事务 。 该 类 型 事务 的 操作 包括 了 数据 


表 10-6 表单 /报表 设计 时 应 遵循 的 原则 


的 检索 和 更 新 。 例 如 ， 查 询 并 显示 某 一 指定 
编号 的 房屋 的 详细 信息 并 更 新 其 月 租金 。 


10.8.2 ”用户 界面 设计 指南 

在 显示 表单 或 报表 之 前 ， 首 先 要 对 其 外 观 和 
布局 进行 设计 。 表 10-6 列 出 了 在 设计 表单 和 报表 
时 应 遵循 的 一 些 原则 (Shneiderman，1992 )。 
使 用 有 意义 的 标题 

标题 传达 的 信息 应 该 清楚 、 明 确 ， 与 表单 / 
报表 所 要 描述 的 问题 一 致 。 
操作 指令 易于 理解 

应 尽量 使 用 用 户 熟 悉 的 术语 自用 户 传 达 操 
作 指 令 。 指 令 信 息 应 该 简短 ， 当 需要 进一步 提示 


使 用 有 意义 的 标题 

操作 指令 易于 理解 

字段 按 逻辑 分 组 和 排序 

表单 /报表 的 布局 视觉 性 强 

用 熟悉 的 字段 标签 

术语 和 缩写 应 保持 一 致 

配色 统一 

数据 录入 字段 应 具有 明显 的 边界 并 预 留 足够 的 空间 
光标 能 够 控制 自如 

易于 纠正 录入 错误 (包括 单个 字符 和 整个 字段 


的 录入 错误 ) 


对 不 可 接受 的 值 给 出 错误 信息 
清楚 地 标记 出 可 选 字段 
为 字段 提供 说 明 性 信息 
录入 完毕 应 给 出 完成 信号 
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时 ， 应 提供 帮助 窗口 。 操 作 指 令 应 使 用 标准 格式 且 文 风 一 致 。 
字段 按 多 辑 分 组 和 排序 

表单 / 报表 中 相关 的 字段 应 集中 于 同一 区 域 ， 字 段 的 排列 顺序 应 符合 逻辑 并 风格 一 致 。 
表单 / 报表 的 布局 视觉 性 强 

表单 /报表 应 该 呈现 给 用 户 一 个 视觉 吸引 力 强 的 界面 。 字 段 或 字段 组 之 间 应 布局 均衡 ， 

应 存在 字段 过 于 密集 或 过 于 分 散 的 区 域 。 字 段 或 字段 组 之 间 应 该 间隔 均匀 。 合 适 的 话 ， 字 
ep WO CRN a tt ee 
用 熟悉 的 字段 标签 

字段 标签 应 该 是 用 户 所 熟悉 的 。 比 如 ， 若 用 “Gender” 人 代替 字段 “Sex”， 则 可 能 有 些 
用 户 会 感到 有 点 糊涂 。 
术语 和 缩写 应 保持 一 致 

使 用 用 户 熟 悉 的 术语 和 缩写 ， 且 前 后 一 致 。 
配色 统一 

色彩 的 使 用 可 以 增强 表单 / 报表 的 视觉 效果 ， 突 出 显示 重要 的 字段 或 信息 。 为 了 达到 这 
个 目的 ， 配 色 必 须 风 格 统一 并 且 意 义 明确 。 例 如 ， 在 某 一 表单 上 ， 痛 景色 为 和 白色 的 字段 表示 
该 字段 为 数据 录入 字段 ， 而 具有 蓝 色 背景 的 字段 仅 为 数据 输出 字段 。 
数据 录入 字段 应 具有 明显 的 边界 并 预 留 足够 的 空间 

用 户 会 留意 到 每 个 录入 字段 的 可 用 空间 ， 这 样 用 户 就 会 在 输入 数值 之 前 考虑 合适 的 数据 
RAK. 
光标 能 够 控制 自如 

用 户 应 该 能 够 自如 地 在 表单 /报表 中 移动 光标 以 选择 其 操作 。 光 标的 控制 可 以 通过 控制 
Tab 键 、 键 盘 方向 键 以 及 鼠标 实现 。 
易于 纠正 录 人 错误 (包括 单个 字符 和 整个 字段 的 录入 错误 ) 

用 户 应 该 能 够 容易 地 改变 字段 已 录入 的 数值 。 可 以 简单 地 使 用 Backspace 键 修改 或 者 重 
新 输入 。 
对 不 可 接受 的 值 给 出 错误 信息 

当 用 户 试图 向 字段 中 输入 不 正确 的 数据 时 ， 应 该 显示 错误 信息 ， 以 提示 用 户 错误 的 类 型 
和 人 允许 录入 的 数值 。 
清楚 地 标记 出 可 选 字段 

可 选 字段 应 该 清楚 地 标示 给 用 户 。 可 以 为 该 字段 选择 一 个 恰当 的 名 称 ， 或 者 用 某 种 特定 
的 颜色 来 显示 这 个 字段 以 表明 该 字段 的 类 型 。 可 选 字段 应 位 于 必 选 字段 之 后 。 
为 字段 提供 说 明 性 信息 

当 用 户 将 光标 停留 在 某 个 字段 上 时 ， 应 该 在 屏幕 上 的 特定 区 域 (如 在 状态 栏 上 ) 显示 关 
于 该 字段 的 信息 。 
录 人 完毕 应 给 出 完成 信号 

应 该 让 用 户 清楚 何 时 已 经 完成 了 表单 上 所 有 字段 的 填写 。 但 不 应 自动 选择 表单 填写 结 
束 ， 因 为 用 户 可 能 希望 检查 一 下 录 人 的 数据 。 
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10.9 建立 原型 系统 


在 设计 过 程 中 ， 关 于 系统 的 初步 实现 ， 我 们 可 以 选择 完全 实现 该 数据 库 系统 或 者 仅仅 建 
立 一 个 原型 系统 。 


| 建立 原型 系统 | 建立 数据 库 系统 的 一 个 工作 模型 。 


原型 只 是 一 个 工作 模型 ， 通 常 并 未 实现 最 终 系统 所 需要 具备 的 所 有 特性 和 功能 。 建 立 数 
据 库 原型 系统 的 主要 目的 是 ,通过 分 析 用 户 对 原型 系统 的 使 用 情况 来 确定 系统 所 提供 的 功能 
是 否 完备 ， 其 至 有 可 能 的 话 ， 用 户 在 使 用 原型 系统 的 过 程 中 ， 还 可 以 提出 改进 建议 甚至 新 的 
功能 需求 。 通 过 开发 原型 系统 ， 可 以 在 很 大 程度 上 帮助 用 户 和 系统 开发 人 员 进 行 沟通 ， 明 确 
用 户 需求 ， 还 能 够 评价 系统 设计 的 可 行 性 。 建 立 原型 系统 应 该 具备 的 特点 是 : 相对 整个 系统 
开发 来 说 费用 不 高 并 且 所 需 时 间 较 短 。 

建立 原型 系统 的 策略 一 般 有 两 种 : 需求 原型 和 进化 原型 。 需 求 原 型 利用 原型 确定 数据 库 
系统 的 需求 ,一 旦 需求 明确 ,该 原型 系统 也 就 无 用 了 。 进 化 原型 和 需求 原型 目的 相同 ,但 最 
重要 的 区 别 在 于 它 并 未 被 抛弃 ， 而 是 经 过 进一步 开发 之 后 演变 为 最 终 的 数据 库 系统 。 


10.10 ”实现 


| 实现 | 数据 库 和 应 用 程序 设计 的 物理 实现 。 


在 设计 阶段 的 工作 完成 后 (可 能 涉及 原型 系统 的 建立 )， 我 们 面临 的 是 数据 库 设 计 和 应 
用 程序 设计 的 物理 实现 。 建 立 物 理 的 数据 库 可 以 利用 所 选 DBMS 的 数据 定义 语言 (DDL) 
来 实现 ， 也 可 以 利用 图 形 用 户 接口 实现 ， 图 形 用 户 接口 提供 了 相同 的 功能 却 隐藏 了 底层 的 
DDL 语句 。DDL 语句 用 于 创建 数据 库 的 结构 并 生成 一 些 空 的 数据 库 文件 。 已 经 确定 的 用 户 
视图 也 要 在 这 一 阶段 定义 。 

应 用 程序 的 开发 可 以 采用 第 三 代 语 言 (3GL) 或 第 四 代 语 言 (4GL)。 应 用 程序 中 关于 
数据 库 事务 处 理 的 部 分 ， 则 由 目标 DBMS 的 数据 操作 语言 (DML) 实现 ，DML 语言 将 被 
tk AS— a E16 A, WW Visual Basic (VB), VB.net, Python, Delphi, C, C++, C#, Java, 
COBOL.. FORTRAN, Ada 或 者 Pascal。 此 外 ， 还 要 实现 应 用 程序 设计 中 出 现 的 其 他 组 件 ， 
如 菜单 、 数 据 录 大 表单 和 报表 等 。 目 标 DBMS 可 能 还 拥有 可 用 于 应 用 程序 快速 开发 的 第 四 
代 工 具 ， 这 些 工 具 包括 非 过 程 化 的 查询 语言 、 报 表 生 成 器 、 表 单 生 成 器 和 应 用 程序 生成 器 。 

系统 的 安全 性 和 完整 性 控制 也 要 在 这 一 阶段 实现 。 某 些 控制 可 使 用 DDEL 来 实现 ， 而 其 
他 的 则 可 能 需要 利用 DBMS 提供 的 实用 工具 或 操作 系统 来 实现 。 注 意 ， 正 如 第 6 ~ 8 章 描 
述 的 那样 ，SQL 既是 DDL 也 是 DML. 


10.11 数据 转换 与 加 载 


| 数据 转换 与 加 载 | 将 已 有 的 数据 转移 到 新 数据 库 中 ， 将 原 有 的 应 用 移植 到 新 数据 库 上 运行 。 


只 有 当 旧 的 数据 库 系统 被 新 的 系统 蔡 换 时 ， 才 需要 进行 数据 转换 与 加 载 。 目 前 ， 大 多 
DBMS 都 具有 在 新 的 数据 库 中 加 载 原 有 数据 库 文件 的 实用 工具 。 完 成 这 一 操作 时 需要 明确 要 加 
载 的 源 文件 以 及 目标 数据 库 ， 并 且 DBMS 能 够 自动 地 转换 源 文 件 的 数据 格式 以 满足 新 数据 库 文 
件 格式 的 有 要求。 数据 移植 就 绪 以 后 ， 开 发 人 员 就 有 可 能 将 原 有 系统 中 的 应 用 程序 移植 到 新 的 系 
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统 中 。 当 需要 进行 数据 转换 与 加 载 时 ， 我 们 应 当 周 密 计 划 ， 以 确保 系统 全 部 功能 的 平滑 移植 。 


10.12 测试 
| 测试 | 运行 数据 库 系 统 ， 试 图 找 出 错误 。 


在 实际 使 用 前 ， 数 据 库 系 统 应 该 经 过 完全 测试 。 测 试 过 程 需要 有 严密 计划 的 测试 策略 和 
真实 的 测试 数据 保证 ， 这 样 整个 测试 过 程 才能 既 系 统 又 严谨 。 注 意 ， 我 们 并 未 提 及 通 稼 意义 
上 测试 的 定义 ， 即 视 测试 为 证 明 无 故障 的 过 程 。 实 际 上 ， 测 试 并 不 能 证 明 没 有 故障 ， 它 只 能 
显露 出 软件 中 存在 故障 。 如 果 测 斌 成功， 测试 结果 将 会 揭示 出 应 用 程序 甚至 数据 库 结构 中 存 
在 的 错误 。 测 试 的 第 二 个 好 处 是 可 以 验证 数据 库 和 应 用 程序 是 否 按照 需求 规格 说 明 书 中 的 要 
求 工作 及 其 是 否 能 够 满足 系统 性 能 要 求 。 另 外 ， 测 试 阶段 收集 的 测试 数据 又 为 衡量 软件 可 靠 
性 和 软件 质量 提供 了 依据 。 

与 数据 库 设 计 一 样 ， 用 户 也 应 参与 测试 过 程 。 理 想 的 测试 环境 应 该 是 一 个 单独 的 硬件 系 
统 及 其 上 的 测试 用 数据 库 ， 但 实际 上 这 通常 是 不 可 能 的 。 如 果 使 用 真实 数据 进行 测试 ， 就 必 
须 做 好 备份 ， 以 防 错误 的 发 生 。 

除 此 之 外 ， 还 应 对 系统 的 可 用 性 进行 测试 ， 理 想 状况 下 ， 还 应 参照 可 用 性 规范 对 其 做 出 
评估 。 可 用 性 的 测试 准则 包括 (Sommerville，2002 ): 

© JFE: 新 用 户 能 够 熟练 操作 该 系统 需 花 费 多 少时 间 ? 

o HEHE: 系统 啊 应 时 间 与 用 户 工作 实际 匹配 得 怎样 ? 

o SHEE: 系统 对 用 户 操作 错误 的 容错 能 力 怎 样 ? 

可 恢复 性 : 系统 从 用 户 错 误 中 恢复 的 能 力 怎 样 ? 

e 适应 性 : 系统 与 单一 的 工作 模式 绑 定 得 有 多 紧 ? 

上 述 准则 的 评测 还 可 以 在 系统 生命 周期 的 其 他 阶段 进行 。 测 试 结束 以 后 ， 数 据 库 系 统 的 
开发 工作 就 宣告 结束 ， 即 将 交付 给 用 户 使 用 。 


10.13 ”运行 维护 


| 运行 维护 | 在 系统 安装 以 后 ， 继 续 对 系统 实施 监控 和 维护 的 过 程 。 


在 前 面 的 阶段 中 ， 数 据 库 系 统 已 经 完全 实现 并 经 过 测试 。 现 在 系统 进入 维护 阶段 ， 这 一 
阶段 包括 以 下 的 活动 : 

o 监控 系统 的 性 能 。 如 果 性 能 低 于 可 以 接受 的 水 平 ， 则 必须 调整 或 重组 数据 库 。 

© 维护 系统 ， 必 要 时 升级 数据 库 系统 。 通 过 生命 周期 前 面 各 阶段 的 努力 ， 新 的 需求 融 

入 了 数据 库 系 统 。 

一 旦 数据 库 系统 开始 全 面 运 行 ， 随 之 就 要 对 其 展开 密切 监控 ， 以 确保 可 接受 的 系统 性 
能 。DBMS 通常 提供 许多 实用 工具 来 辅助 数据 库 管理 ， 其 中 包括 数据 加 载 工 具 和 系统 监控 工 
具 。 系 统 监控 工具 可 以 提供 的 信息 包括 数据 库 的 使 用 情况 、 加 锁 效 率 〈 包 括 已 发 生 的 死 锁 个 
数 等 ) 和 查询 执行 策略 。 数 据 库 管 理 员 (DBA) 利用 这 些 信息 进行 系统 调 优 ， 例 如 ， 创 建 索 
引 、 改 变 存 储 结构 、 合 并 或 分 割 表 以 提高 查询 速度 。 

对 系统 的 监控 贯穿 于 数据 库 系 统 的 整个 运行 期 间 ， 使 得 数据 库 能 够 及 时 得 到 重组 以 满足 
不 断 变化 的 需求 。 反 过 来 ， 这 些 需求 上 的 变化 又 能 够 为 系统 的 演进 以 及 未 来 可 能 需要 的 资源 
提供 信息 。 这 种 相互 作用 加 上 对 提出 的 新 应 用 的 认 知 ， 使 得 DBA 能 够 集中 精力 进行 数据 库 
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规划 或 提请 上 级 注意 调整 规划 。 如 果 DBMS 缺乏 相关 的 工具 ，DBA 既 可 以 目 行 开发 ， 也 可 
购买 第 三 方 适 用 的 工具 。 我 们 将 在 第 20 章 详细 讨论 数据 库 的 管理 。 

当 新 的 数据 库 应 用 程序 投入 使 用 后 ， 在 一 段 时 期 内 ， 用 户 可 能 同时 并 行使 用 新 、 旧 系 
统 。 考 虑 到 新 系统 可 能 会 出 现 难以 预料 的 问题 ， 并 行使 用 两 套 系统 能 够 保证 当前 系统 运行 的 
正确 性 。 应 该 定期 对 新 、 旧 系统 就 数据 一 致 性 问题 进行 检验 。 只 有 当 两 个 系统 总 是 能 产生 一 
致 的 结果 时 ， 旧 系统 才 可 以 停 用 。 如 果 系 统 的 换代 过 于 仓促 ， 最终 可 能 融 来 灾难 性 的 后 采 。 
不 考虑 前 面 提 到 的 旧 系 统 可 能 停 用 的 假设 ， 可 能 会 存在 对 两 个 系统 同时 进行 维护 的 情形 。 


10.14 CASE 工具 


在 数据 库 系统 开发 生命 周期 的 第 一 阶段 ， 也 就 是 数据 库 规 划 阶 段 ， 可 能 还 会 涉及 计算 机 
辅助 软件 工程 (CASE) 工具 的 选择 问题 。 从 广义 上 说 ， 任 何 一 种 能 够 支持 软件 工程 的 工具 
都 是 CASE 工具 。 数 据 管理 员 和 数据 库 管 理 员 需 要 合适 且 高 效 的 工具 ， 以 保证 数据 库 系统 的 
开发 活动 尽 可 能 有 效 且 高 效 。CASE 对 数据 库 系统 开发 活动 的 支持 包括 : 

© 存储 关于 数据 库 系 统 数据 的 相关 信息 的 数据 字典 。 

© 文 持 数据 分 析 的 设计 工具 。 

e 文 持 企业 数据 模型 、 概 念 数据 模型 和 人 逻辑 数据 模型 开发 的 工具 。 

e 建立 原型 系统 的 工具 。 

CASE 工具 可 分 为 三 类 : EJZ CASE (Upper-CASE) 工具 、 底 层 CASE ( Lower-CASE) 
工具 和 集成 CASE (Integrated-CASE) TH, WA 10-6 所 示 。 上 层 CASE 工具 支持 数据 库 系 
统 生命 周期 的 前 期 工作 一 一 从 数据 库 规划 到 数据 库 设 计 。 底 层 CASE 工具 文 持 数据 库 系 统 生 
命 周 期 的 后 期 工作 一 一 从 实现 、 测 试 到 运行 维护 。 集 成 CASE 工具 支持 数据 库 系统 生命 周期 
的 全 部 阶段 的 工作 ， 因 此 兼 具 上 层 CASE 和 底层 CASE 工具 的 全 部 功能 。 


上 层 
CASE 





集成 
CASE 





底层 
CASE 
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10-6 CASE 工具 的 应 用 
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使 用 CASE 工具 的 优点 
使 用 合适 的 CASE 工具 应 该 能 够 提高 数据 库 系 统 开 发 的 生产 率 。“ 生 产 率 ”的 含义 包括 
开发 过 程 的 效率 和 所 开发 系统 的 有 效 性 。 效 率 是 指 成 本 ， 即 实现 数据 库 系统 的 时 间 和 经 费 开 
fio CASE 工具 通过 对 系统 开发 提供 相应 支持 并 使 开发 过 程 自动 化 来 提高 开发 效率 。 有 效 性 
是 指 系统 对 用 户 需 求 的 满足 程度 。 在 追求 更 高 的 生产 率 时 ， 提 高 开发 过 程 的 有 效 性 可 能 比 提 
高 效率 更 为 重要 。 例 如 ， 开 发 人 员 无 视 最 终 产品 是 否 为 用 户 所 想 要 的 产品 而 盲目 追求 开发 过 
程 的 极端 高 效率 并 非 明 智之 举 。 也 就 是 说 ， 有 效 性 同 最 终 产品 的 质量 密切 相关 。 由 于 计算 机 
比 人 更 胜任 某 些 特殊 的 工作 ， 如 一 致 性 检查 ， 因 此 CASE ENERET AETR 
些 工 作 的 有 效 性 。 
对 于 提高 生产 率 ，CASE 工具 在 以 下 各 个 方面 都 具有 优越 性 : 
e 标准 化 。CASE 工具 有 助 于 强化 软件 项 目 开 发 过 程 的 标准 化 或 者 组 织 内 部 工作 流程 
的 标准 化 。CASE 工具 有 助 于 生成 可 复 用 的 标准 测试 组 件 ， 以 简化 维护 工作 并 提高 生 
产 率 。 
o 集成 化 。CASE 工具 将 所 有 信息 均 保 存在 仓库 (repository) 或 数据 字典 中 。 因 此 ， 利 
用 CASE 工具 就 可 以 将 从 数据 库 系统 生命 周期 各 阶段 收集 到 的 数据 存储 起 来 ， 并 且 
通过 数据 之 间 的 关联 来 保证 系统 各 部 分 的 集成 性 。 这 样 一 个 组 织 机 构 的 信息 系统 就 
不 再 是 由 一 些 独立 的 、 无 关 的 部 分 组 成 。 
© 支持 标准 化 方法 。 结 构 化 技术 使 得 图 表 的 使 用 具有 重要 意义 ， 而 图 表 的 手工 绘制 和 
维护 是 相当 困难 的 ，CASE 工具 简化 了 这 一 过 程 ， 能 够 生成 正确 且 更 为 通用 的 文档 。 
e 一 致 性 。 由 于 存储 在 数据 字典 中 的 信息 之 间 存 在 着 内 在 的 联系 ， 因 此 可 以 利用 
CASE 工具 进行 一 致 性 的 检查 。 
e 自动 化 。 一 些 CASE 工具 可 以 自动 地 将 设计 规格 说 明 书 转换 为 可 执行 代码 。 这 样 不 
仅 可 以 减少 系统 开发 的 工作 量 ， 还 可 以 消除 编码 过 程 中 出 现 的 错误 。 


本 章 小 结 

o 信息 系统 是 一 种 在 组 织 机 构 内 用 于 收集 、 管 理 、 控 制 和 分 发 信息 的 资源 。 

基于 计算 机 的 信息 系统 包括 下 面 几 个 部 分 : 数据 库 、 数 据 库 软 件 、 应 用 软件 、 计 算 机 硬件 (包括 存 
储 介质 )， 以 及 使 用 和 开发 系统 的 活动 。 

e 数据 库 是 信息 系统 的 基础 构件 ， 应 该 从 企业 的 需求 这 一 更 加 广泛 的 角度 来 考虑 数据 库 的 开发 及 使 
用 。 因 此 ， 信 息 系统 的 生命 周期 同 支撑 它 的 数据 库 系 统 的 生命 周期 之 间 有 着 内 在 的 联系 。 

数据 库 系统 开发 生命 周期 的 主要 阶段 包括 : 数据 库 规划 、 系 统 定义 、 需 求 收集 与 分 析 、 数 据 库 设计 、 
DBMS 选 型 (可 选 )、 应 用 程序 设计 、 建 立 原型 系统 (可 选 ) 实现 、 数 据 转换 与 加 载 、 测 试 和 运行 
维护 。 

数据 库 规 划 是 一 种 管理 活动 ， 目 的 是 尽 可 能 高 效 及 有 效 地 实现 数据 库 系 统 开 发 生命 周期 的 各 个 
阶段 。 

系统 定义 包括 确定 数据 库 系 统 的 范围 、 边 界 和 用 户 视图 。 用 户 视图 从 一 个 特定 的 角色 (如 经 理 或 主 
管 ) 或 者 特定 的 企业 应 用 方面 (如 销售 、 人 事 或 库存 管理 ) 的 角度 来 定义 数据 库 系统 的 需求 。 
需求 收集 与 分 析 是 一 个 收集 、 分 析 企业 需要 数据 库 系 统 支持 的 信息 并 由 此 定义 系统 需求 的 过 程 。 对 
于 支持 多 用 户 视图 的 数据 库 系 统 ， 主 要 有 三 种 需求 管理 方法 : 集中 式 方法 、 视 图 集成 方法 以 及 两 种 
方法 的 综合 使 用 。 
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集中 式 方法 将 数据 库 系 统 中 不 同 用 户 视 图 的 需求 聚集 成 一 个 需求 集合 ， 在 数据 库 设计 阶段 统一 生成 
一 个 能 够 表示 所 有 用 户 视图 需求 的 数据 模型 。 视 图 集成 方法 则 分 别 分 析 每 个 用 户 视图 的 需求 ， 并 为 
每 个 用 户 视 图 建立 单独 的 数据 模型 ， 直 到 数据 库 设计 阶段 才 将 这 些 数 据 模型 合 而 为 一 。 

数据 库 设计 是 一 个 为 企业 所 需 数据 库 系 统 生成 设计 方案 的 过 程 ， 该 设计 方案 能 够 支持 企业 的 任务 描 
述 并 满足 其 开发 数据 库 系统 的 目的 。 数 据 库 设 计 分 为 三 个 阶段 : 概念 数据 库 设 计 、 逻 辑 数 据 库 设计 
和 物理 数据 库 设 计 。 

概念 数据 库 设 计 是 一 个 建立 概念 数据 模型 的 过 程 ， 该 模型 与 所 有 物理 因素 无 关 。 

逻辑 数据 库 设 计 是 在 已 有 的 概念 数据 模型 的 基础 上 建立 逻辑 数据 模型 ， 该 模型 与 具体 的 DBMS 以 
及 其 他 物理 因素 无 关 。 

物理 数据 库 设 计 是 描述 在 辅助 存储 器 上 如 何 实 现 数据 库 的 过 程 。 物 理 数据 库 设计 定义 了 基础 关系 、 
文件 组 织 方 式 和 为 提高 数据 访问 效率 的 索引 ， 以 及 所 有 的 完整 性 约束 和 安全 措施 。 

DBMS 选 型 是 为 数据 库 系统 选择 一 个 合适 的 DBMS 的 过 程 。 

应 用 程序 设计 包括 用 户 界面 设计 和 事务 设计 ， 描 述 了 应 用 程序 对 数据 库 的 使 用 和 访问 。 数 据 库 的 事 
务 是 由 单个 用 户 或 应 用 程序 执行 的 ， 访 问 或 更 新 数据 库 的 一 个 或 一 组 操作 。 

建立 原型 系统 就 是 建立 数据 库 系统 的 工作 模型 ， 为 设计 人 员 或 者 用 户 提供 一 个 可 视 、 可 操作 的 系统 
并 能 够 对 该 系统 进行 评估 。 

实现 是 数据 库 和 应 用 设计 的 物理 实现 。 

数据 转换 与 加 载 是 指 将 原 有 的 数据 移植 到 新 的 数据 库 中 ， 同 时 移植 原 有 的 应 用 程序 并 使 其 能 够 在 新 
的 数据 库 上 运行 。 

测试 是 运行 数据 库 程 序 并 试图 找 出 错误 的 过 程 。 

运行 维护 是 在 系统 安装 以 后 继续 对 系统 实施 监控 和 维护 的 过 程 。 

计算 机 辅助 软件 工程 (CASE) 工具 是 指 任何 支持 软件 开发 并 能 够 使 得 数据 库 系 统 的 开发 活动 尽 可 能 
高 效 且 有 效 的 工具 。CASE 工具 可 分 为 三 类 : 上 层 CASE 工具 、 底 层 CASE 工具 和 集成 CASE 工具。 


思考 题 


10.1 描述 信息 系统 的 主要 组 成 部 分 。 

10.2 ”讨论 信息 系统 生命 周期 和 数据 库 系统 开发 生命 周期 之 间 的 关系 。 

10.3 ”描述 数据 库 系统 开发 生命 周期 各 阶段 的 主要 目的 和 活动 。 

10.4 ”讨论 用 户 视 图 在 数据 库 系统 中 的 含义 。 

10.5 处理 多 用 户 视图 的 数据 库 系 统 设计 方法 有 哪些 ? 

10.6 ”比较 数据 库 设计 的 三 个 阶段 。 

10.7 ”数据 建 模 和 确定 最 佳 数据 模型 标准 的 目的 是 什么 ? 

10.8 在 什么 阶段 进行 DBMS 选 型 是 合适 的 ?给 出 一 种 选择 “最 佳 ”DBMS 的 方法 。 
10.9 ”应 用 程序 设计 包括 事务 设计 和 用 户 界 面 设计 ， 描 述 其 目的 和 与 之 相关 的 主要 活动 。 
10.10 ”讨论 为 什么 测试 并 不 能 证 明 软 件 的 正确 性 ， 而 只 能 反映 出 软件 中 存在 的 错误 。 
10.11 描述 在 开发 数据 库 系统 时 使 用 原型 方法 的 主要 优点 。 


>a 
10.12 ”假设 由 你 负责 帮 单 位 的 一 组 用 户 选择 一 款 新 的 DBMS 产品 。 为 了 完成 此 题 ， 你 必须 首先 明确 
这 组 用 户 的 需求 ， 并 且 明 确 为 了 满足 这 些 需求 ，DBMS 产品 应 该 具备 的 特性 。 描 述评 估 和 选择 
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“EAE” DBMS 产品 的 过 程 。 

10.13 对 附录 B 中 的 每 个 案例 研究 ， 描 述 为 其 评 佑 和 选择 DBMS 产品 的 过 程 。 

10.14 假设 你 是 一 家 专门 提供 数据 库 分 析 、 设 计 和 实现 咨询 的 公司 的 雇员 。 最近 有 客户 来 公司 咨询 数 
据 库 系统 实现 的 事 , 但 他 不 熟悉 开发 过 程 。 所 以 公司 要 求 你 为 他 们 简要 介绍 一 下 数据 库 系统 开 
发 生命 周期 (DSDL) 的 概念 以 及 主要 阶段 的 工作 。 带 着 这 个 任务 ,准备 PPT 和 介绍 材料 。( 本 
题 中 的 客户 既 可 是 附录 B 中 任 一 假想 的 案例 研究 ， 也 可 以 是 由 你 或 你 的 老师 指定 的 任何 真正 的 
公司 。) 


10.15 “本 题 要 求 你 首先 获得 许可 ， 能 访问 一 名 或 多 名 负责 开发 和 管理 真实 数据 库 系统 的 人 员 。 拜 访 他 


们 时 ， 试 图 获得 如 下 信息 : 
(a) 开发 数据 库 采 用 的 方式 。 


(b) 所 采用 方式 与 本 章 描述 的 DSDL 有 何 异 同 ? 


(c) 其 数据 库 系 统 中 不 同 用 户 的 需求 (用户 视图 ) 是 如 何 管 理 的 ? 
(d) 是 否 用 到 CASE 工具 支持 数据 库 系统 的 开发 ? 


(e) 如 何 评 估 和 挑选 DBMS 工具 ? 
(£) 数据 库 系统 是 如 何 监控 和 维护 的 ? 
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数据 库 分 析 与 DreamHome 案例 研究 








本 章 我 们 主要 学 习 : 
在 数据 库 应 用 系统 开发 生命 周期 中 何 时 使 用 实况 发 现 技术 
在 数据 库 系 统 开 发 生命 周期 的 每 个 阶段 需要 收集 的 实况 的 类 型 
在 数据 库 系统 开发 生命 周期 的 每 个 阶段 需要 生成 的 文档 的 类 型 
最 常用 的 实况 发 现 技术 
如 何 使 用 各 种 实况 发 现 技 术 以 及 每 种 实况 发 现 技术 的 优 缺点 
一 个 称 为 DreamHome 的 房屋 租赁 公司 数据 库 系 统 
如 何在 数据 库 系 统 开发 生命 周期 的 前 期 阶段 应 用 实况 发 现 技术 


在 第 10 章 中 ， 我 们 已 经 就 数据 库 系 统 开 发 生命 周期 的 各 个 阶段 进行 了 讨论 。 在 这 些 阶 
段 中 ， 常 常会 出 现 这 样 的 关键 时 刻 ， 即 数据 库 开发 人 员 必 须 获取 继续 进行 数据 库 系 统 开发 所 
必需 的 实况 ( fact)。 这 些 必要 的 实况 包括 该 企业 使 用 的 工作 术语 、 在 使 用 当前 系统 时 过 到 的 
问题 、 新 的 系统 可 能 为 企业 带 来 的 机 遇 、 新 的 系统 中 对 数据 和 用 户 添 加 的 必要 约束 、 新 系统 
中 需求 的 轻重 缓急 程度 。 要 想 获 得 这 些 实况 就 需要 借助 于 实况 发 现 (fact-finding) 技术 。 


实况 发 现 | 使 用 面谈 、 问 卷 调查 等 技术 手段 收集 关于 系统 、 需 求 和 优先 考虑 (preference) 
等 实况 信息 的 规范 化 的 过 程 。 


本 章 将 讨论 数据 库 开发 人 员 什 么 时 候 可 能 会 使 用 实况 发 现 技 术 ， 应 该 获取 哪些 类 型 的 实 
况 。 还 将 概述 如 何 使 用 这 些 实况 生成 一 些 主要 的 文档 ， 而 这 些 文档 在 整个 数据 库 系统 开发 生 
命 周 期 中 都 要 使 用 。 我 们 将 讲述 最 常用 的 实况 发 现 技术 ， 并 指出 每 种 技术 的 优 缺 点 。 最 后 ， 
以 房屋 租赁 公司 一 一 DreamHome 的 数据 库 系统 开发 为 例 ， 示 范 在 数据 库 系 统 开 发 生命 周期 
的 前 期 阶段 如 何 使 用 实况 发 现 技术 。DreamHome 案例 研究 将 贯穿 全 书 。 
| 本 章 结构 

11.1 节 讨 论 了 数据 库 开 发 人 员 在 何 时 可 能 使 用 实况 发 现 技 术 ( 在 本 书 中 ， 数 据 库 开 发 人 
员 是 指 负责 分 析 、 设 计 和 实现 数据 库 系 统 的 有 关 人 员 )。11.2 节 说 明了 在 数据 库 系统 开发 生 
命 周期 的 每 个 阶段 应 该 采集 的 实况 类 型 和 应 该 生成 的 文档 。11.3 节 描 述 了 五 种 最 常 使 用 的 
实况 发 现 技术 ， 并 指出 了 每 种 技术 的 优点 和 缺点 。11.4 PHU DreamHome 房屋 租赁 公司 为 
例 ， 示 范 在 开发 数据 库 系 统 期 间 如 何 使 用 实况 发 现 技术 ， 在 这 一 小 节 ， 我 们 首先 简要 介绍 
DreamHome 样 例 ， 然 后 以 DreamHome 为 例 详 细 研 究 数据 库 系统 开发 生命 周期 的 前 三 个 阶 
Be: 数据 库 规划 、 系 统 定义 以 及 需求 收集 与 分 析 。 针 对 每 一 个 阶段 ， 示 范 如 何 使 用 实况 发 现 
技术 收集 数据 ， 并 描述 在 此 过 程 中 生成 的 文档 。 





1È RLBEDHS DreamHome FHAFK 253 


11.1 使 用 实况 发 现 技术 的 时 机 


在 数据 库 系 统 开发 生命 周期 中 有 很 多 的 时 机 可 以 使 用 实况 发 现 技 术 ， 但 是 ， 在 生命 周期 
的 前 期 阶段 ， 包 括 数 据 库 规划 、 系 统 定义 和 需求 收集 与 分 析 阶 段 ， 实 况 发 现 显得 尤为 关键 。 
在 这 些 阶 段 ， 数 据 库 开发 人 员 需 要 获取 一 些 重 要 的 实况 ， 这 些 实况 是 数据 库 系 统 开 发 所 必需 
的 。 尽 管 在 数据 库 设 计 以 及 生命 周期 的 后 期 阶段 也 会 用 到 实况 发 现 技术 ， 但 其 重要 性 没有 在 
前 期 阶段 那么 强 。 比 如 ,在 物理 数据 库 设 计 期 间 ， 当 数据 库 开 发 人 员 试 图 了 解 更 多 的 关于 
DBMS 选 型 的 信息 时 ， 会 用 到 实况 发 现 技 术 。 同 样 ， 在 最 后 的 运行 维护 阶段 ， 可 以 应 用 实况 
发 现 技术 来 确定 系统 是 否 需要 调 优 以 提高 性 能 ， 或 者 为 满足 新 的 需求 而 进一步 开发 。 

注意 : 对 于 一 个 数据 库 项 目 ， 事先 对 实况 发 现 所 需 的 时 间 和 投入 做 个 大 概 的 估计 是 非常 
重要 的 。 在 第 10 章 曾 经 提 到 ， 考 虑 过 细 会 陷 人 分 析 僵局 (paralysis by analysis), Ail, # 
虑 过 粗 则 会 导致 在 理解 错误 的 基础 上 继续 寻求 错误 的 解决 方案 ， 从 而 导致 不 必要 的 时 间 和 人 金 
钱 的 浪费 。 


11.2 ”收集 实况 的 类 型 

在 数据 库 系 统 开发 生命 周期 期 间 ， 数 据 库 开发 人 员 需 要 获取 现 有 系统 或 新 系统 的 实况 。 
K 11-1 的 示例 中 给 出 了 在 生命 周期 各 个 阶段 需要 采集 的 数据 分 类 以 及 每 个 阶段 生成 的 文档 。 
我 们 曾 在 第 10 章 中 提 到 ， 数 据 库 系统 开发 生命 周期 的 各 阶段 并 非 严格 遵循 既 有 顺序 ， 而 是 
存在 一 定 程度 的 迭代 ， 即 通过 反馈 重复 先前 阶段 的 活动 。 对 于 数据 采集 和 文档 的 生成 也 是 如 
此 。 比 如 ， 在 数据 库 设计 阶段 遇 到 的 问题 可 能 有 必要 重 返 需求 收集 与 分 析 阶 段 ， 以 采集 更 多 
的 数据 。 


表 11-1 数据 库 系统 开发 生命 周期 各 个 阶段 需要 获取 的 数据 以 及 生成 的 文档 


数据 库 系统 开发 生命 
周期 的 各 个 阶段 需要 获取 的 数据 需要 生成 的 文档 
数据 库 规划 数据 库 项 目的 目的 与 目标 数据 库 系 统 的 任务 描述 和 任务 目标 


系统 定义 描述 主要 用 户 视图 (包括 不 同 的 工 | 定义 数据 库 应 用 程序 的 范围 和 边界 ， 定义 
i 作 角 色 和 不 同 的 商业 应 用 领域 ) 用 户 视 图 


需求 收集 与 分 析 用 户 视图 的 需求 ;系统 规范 ,包括 | ”用 户 和 系统 的 需求 规格 说 明 书 


STR 用 户 对 逻辑 数据 库 设计 的 意见 和 建 | ”概念 /逻辑 数据 库 设计 (包括 ER 模型 、 
议 ; 目标 DBMS 的 功能 数据 字典 、 关 系 模式 )， 物 理 数 据 库 设计 
应 用 程序 设计 用 户 对 界面 设计 的 意见 和 建议 =e 设计 (包括 对 程序 和 用 户 界面 的 
P t I j 这 





性 能 和 安全 需求 


DBMS 选 型 目标 DBMS 的 功能 DBMS 的 评估 和 推荐 选 型 
建立 原型 系统 用 户 对 原型 系统 的 意见 和 建议 修改 用 户 需求 和 系统 规范 


实现 目标 DBMS 的 功能 
当前 数据 的 格式 ; 目标 DBMS 的 数 
数据 转换 与 加 载 据 导入 性 能 


性 能 测试 结果 ; 新 增 或 修改 以 后 的 | ”用 户 手册 ; 性 能 分 析 ; 修改 以 后 的 用 户 需 


用 户 和 系统 需求 求 和 系统 规范 
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11.3 ”实况 发 现 技 术 


数据 库 开 发 人 员 在 一 个 数据 库 项 目的 开发 期 间 通 常会 使 用 几 种 实况 发 现 技术 ， 以 下 是 五 
种 经 常 使 用 的 实况 发 现 技术 : 

© 分 析 文 档 资料 

。 面谈 

© 观察 企业 的 运作 

。 研究 

。 问卷 调查 

在 后 面 的 小 节 中 ， 将 讲述 这 些 实况 发 现 技术 ， 并 指出 每 种 技术 的 优点 和 缺点 。 


11.3.1 分 析 文 档 资料 


分 析 文 档 资 料 有 助 于 了 解 一 些 内 幕 信 息 ， 比 如 对 数据 库 的 需求 是 如 何 提出 的 。 此 外 ， 还 
可 以 帮助 我 们 找到 与 解决 所 遇 问 题 有 关 的 企业 这 一 方 的 有 用 信息 。 如 果 问 题 与 当前 运行 的 系 
统 相 关 ， 那 么 就 应 该 存在 与 该 系统 相关 的 文档 资料 ， 通 过 分 析 这 些 文档 、 表 单 、 报 表 和 文 
件 ， 便 能 够 迅速 地 理解 该 系统 。 表 11-2 列 出 了 应 该 分 析 的 文档 资料 的 例子 。 


表 11-2 应 分 析 的 文档 资料 的 示例 


文档 资料 的 用 途 有 用 的 资源 示例 
内 部 备忘录 、 电 子 邮 件 、 会 议 记录 
描述 数据 库 的 问题 和 需要 员工 /客户 的 投诉 以 及 记载 这 些 问题 的 文档 
性 能 的 评审 / 报表 


企业 /单位 的 图 表 、 任 务 陈述 和 企业 /单位 的 战略 规划 
所 调研 的 企业 /单位 部 门 的 目标 
描述 企业 受 问 题 影响 的 部 分 任务 /工作 描述 
完全 手工 制作 的 表单 和 报表 样 例 
完全 由 计算 机 处 理 的 表单 和 报表 样 例 
各 种 流程 图 和 图 表 
数据 字典 
描述 当前 运行 的 系统 数据 库 系统 设计 
程序 文件 的 编制 
用 户 /培训 手册 


11.3.2 ”面谈 


面谈 是 最 常 使 用 ， 通常 也 是 最 有 用 的 实况 发 现 技 术 。 面 谈 通过 与 人 面对面 的 交流 来 收集 
信息 。 使 用 面谈 有 这 样 几 个 目的 : 发 现实 况 、 核 实 实况 、 澄 清 实况 、 激 发 热情 、 使 终端 用 户 
也 参与 进来 、 明 确 需 求 、 汇 集 想法 和 意见 。 然 而 ， 面 谈 技 术 的 使 用 需要 良好 的 沟通 技能 ， 只 
有 这 样 才 能 有 效 地 与 那些 具有 不 同 的 价值 观 、 地 位 、 想 法 、 动 机 和 个 性 的 人 交流 。 同 其 他 的 
实况 发 现 技术 相 比 ， 面 谈 并 不 是 对 所 有 情形 都 是 最 好 的 方法 。 表 11-3 列 出 了 面谈 技术 的 优 
点 和 缺点 。 
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表 11-3 面谈 技术 的 优点 和 缺点 


fi 点 fk 点 
被 访问 者 可 以 自由 地 回答 问题 ， 而 且 对 问题 毫 无 隐瞒 | ”非常 耗 时 且 成 本 太 高 、 因 而 可 能 是 不 切实 际 的 
使 得 被 访问 者 觉得 自己 是 项 目的 参与 者 面谈 的 成 功 与 否 依赖 于 访问 者 的 沟通 技能 


访问 者 可 以 持续 地 对 被 访问 者 感 兴趣 的 话题 进行 追问 Ca 


访问 者 可 以 在 面谈 中 随时 对 问题 进行 调整 或 者 对 同一 
个 问题 换 一 种 提 法 


访问 者 可 以 观察 到 被 访问 者 的 肢体 语言 


面谈 的 方式 有 两 种 : 无 组 织 的 和 有 组 织 的 。 无 组 织 的 面谈 在 访问 者 的 脑海 里 只 有 一 个 大 
概 的 目标 ， 几 乎 没有 什么 明确 的 问题 。 访 问 者 依靠 被 访问 者 建立 面谈 的 框架 ， 由 被 访问 者 引 
导 面 谈 的 方向 。 无 组 织 的 面谈 通常 会 偏离 谈话 的 主题 ， 也 正 是 由 于 这 个 原因 ， 这 类 会 谈 对 数 
据 库 的 分 析 和 设计 帮助 不 大 。 

在 有 组 织 的 面谈 中 ， 访 问 者 准备 了 一 组 明确 的 问题 对 被 访问 者 提问 。 根 据 被 访问 者 的 
回答 ， 访 问 者 将 提出 更 多 的 问题 以 澄清 问题 或 对 问题 加 以 扩展 。 开 放 式 问题 open-ended 
question) 允许 被 访问 者 随心 所 欲 地 回答 ， 只 要 言 之 有 理 即 可 。 例 如 “你 为 什么 对 客户 注册 报 
表 不 满意 ? ”就 是 一 个 开放 式 问 题 。 封 闭 式 问 题 (closed-ended question) 将 答案 限定 为 要 么 给 
出 明确 的 选择 要 么 简短 直接 地 回答 。“ 你 是 否 能 够 准时 收 到 客户 注册 报表 ? ”或 者 “用 户 注 册 
报表 上 的 信息 是 否 正确 ?” 都 属于 封闭 式 问题 ， 这 两 个 文 题 仅仅 需要 回答 “是 ”或 “不 是 ”。 

要 想 保 证 面谈 成 功 ， 需 要 选择 合适 的 被 访问 者 、 事 先 做 好 充分 的 准备 以 及 以 高 效 且 有 效 
的 方式 引导 面谈 的 进行 。 


11.3.3 ”观察 企业 的 运作 


要 理解 一 个 系统 的 运作 方式 ， 最 有 效 的 实况 发 现 技 术 就 是 观察 。 应 用 这 种 技术 ,你 就 有 
可 能 通过 亲身 参与 或 仅仅 是 在 一 旁观 看 一 个 人 的 活动 过 程 来 了 解 系统 。 当 对 采用 其 他 方法 收 
集 到 的 有 效 数据 还 存在 疑问 时 ,或 者 由 于 系统 某 些 方面 的 复杂 性 使 得 终端 用 户 无 法 清楚 解释 
时 ， 观 察 就 会 显得 特别 有 用 。 

与 其 他 的 实况 发 现 技术 一 样 ， 成 功 的 观察 需要 精心 的 准备 。 为 了 确保 观察 的 成 功 ， 很 重 
要 的 一 点 是 尽 可 能 多 地 了 解 将 要 观察 的 人 或 业务 活动 。 例 如 ， 观 察 者 需要 深入 了 解 “ 所 要 观 
察 的 业务 活动 的 低 发 、 正 常 和 高 峰 时 段 分 别 是 什么 时 候 ?” 以 及 “ 若 有 人 在 劳 观察 并 记录 ， 
被 观察 者 的 行为 是 否 会 失常 ?” 等 问题 。 表 11-4 列 出 了 观察 技术 的 优点 和 缺点 。 


表 11-4 ”观察 技术 的 优点 和 缺点 


fi A 缺 点 
可 以 检验 实况 与 数据 的 有 效 性 被 观察 者 可 能 有 意 或 无 意 地 表现 失常 


由 于 观察 时 间 有 限 ， 可 能 会 遗漏 掉 同 一 时 间 段 可 能 出 
现 的 难度 不 同 的 任务 或 者 无 法 观察 到 正常 的 工作 量 


观察 者 还 可 以 获得 描述 业务 任务 的 物理 环境 的 数据 有 些 任务 并 不 总 是 以 它 被 观察 时 的 方式 执行 
成 本 相对 较 低 可 能 不 现实 
观察 者 可 以 进行 工作 度量 


观察 者 可 以 确切 地 看 到 正在 进行 的 一 切 
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11.3.4 WR 

为 一 种 有 用 的 实况 发 现 技 术 是 就 应 用 和 问题 本 号 进行 详细 人 研究。 计算 机 行业 期 刊 、 参 考 
书籍 和 因特网 (包括 用 户 组 和 公告 板 ) 都 是 很 好 的 信息 资源 。 这 些 信息 资源 能 够 提供 别人 解 
决 相似 问题 的 方法 ,以 及 是 否 存在 能 够 解决 或 者 部 分 解决 该 问题 的 软件 包 。 表 11-5 列 出 了 
研究 技术 的 优点 和 缺点 。 


表 11-5 ”使 用 研究 作为 实况 发 现 技 术 的 优点 和 缺点 


优 点 缺 A 
如 果 已 有 解决 方案 ， 则 可 以 节约 时 间 需要 访问 适当 的 信息 资源 
研究 人 员 可 以 参看 别人 解决 类 似 问题 或 满足 类 似 需 求 可 能 会 因为 没有 相关 文档 而 于 事 无 补 
的 解决 方案 
人 研究 人 员 能 够 追踪 了 解 当 前 的 最 新 发 展 


11.3.5 ”问卷 调查 


通过 问卷 的 方式 进行 调查 也 是 一 种 实况 发 现 技 术 。 问 卷 调查 表 是 一 类 具有 特定 目的 的 文 
档 ， 利 用 问卷 调查 表 能 够 从 大 量 的 人 和 群 中 收集 实况 ， 并 且 答 案 具 有 一 定 的 可 控 性 。 当 面 对 大 
量 的 被 调查 者 时 ， 没 有 哪 种 实况 发 现 技 术 能 够 像 问卷 调查 一 样 如 此 高 效 地 收集 到 同样 多 的 实 
况 信息 。 表 11-6 列 出 了 问卷 调查 技术 的 优点 和 缺点 。 


表 11-6 ”问卷 调查 技术 的 优点 和 缺点 


fi 点 缺 点 
被 问卷 者 可 以 在 其 方便 的 时 候 完 成 并 交 回 调查 表 返回 问卷 者 的 人 数 比 较 少 ， 可 能 只 有 5% 一 10% 
以 一 种 成 本 相对 较 低 的 方式 从 大 量 的 人 群 手中 收集 数据 | ”返回 的 调查 表 可 能 并 未 完全 作答 
由 于 问卷 结果 保密 ,被 问卷 者 更 有 可 能 提供 真实 的 情况 | “对 于 被 误解 的 问题 ， 无 法 修改 或 者 重 述 
可 以 将 问卷 结果 列表 并 进行 快速 分 析 无 法 观察 和 分 析 被 问卷 者 的 肢体 语言 


问卷 调查 表 里 可 以 包括 两 类 问题 ， 即 自由 格式 和 固定 格式 的 问题 。 自 由 格式 的 问题 为 回 
丛 问 题 者 在 作答 时 提供 了 较 大 的 自由 度 。 在 问题 后 面 ， 留 有 相应 的 空白 用 来 作答 。 自 由 格式 
的 问题 有 “你 通常 会 收 到 哪些 报表 ?如 何 使 用 它们 ?” 以 及 “这 些 报 表 有 什么 问题 吗 ? 如 果 
有 ， 请 说 明 。 等 。 自 由 格式 问题 的 难点 在 于 被 问卷 者 的 答案 难于 列表 统计 ， 有 的 还 可 能 答 
非 所 问 。 

固定 格式 的 问题 需要 明确 作答 。 对 于 每 一 个 问题 ， 被 问卷 者 都 必须 从 给 出 的 答案 中 选 
择 。 这 样 ， 很 容易 对 问卷 结果 列表 统计 。 但 从 另 一 方面 来 看 ， 被 问卷 者 可 能 无 法 提供 一 些 也 
许 有 用 的 额外 信息 。 固 定格 式 问题 的 示例 是 :“ 当 前 使 用 的 房屋 租赁 报表 是 切实 可 行 的 ,无 
需 更 改 。” 被 问卷 者 可 能 需要 从 “是 ”或 “ 否 ” 中 选择 ,或 者 从 “完全 同意 “同意 ”“ 没 有意 
见 ”“ 不 同意 ”和 “强烈 反对 ”中 选择 。 


11.4 使 用 实况 发 现 技术 的 实例 


本 节 首 先 概述 DreamHome 案例 研究 ， 然 后 使 用 该 案例 讨论 如 何 建立 一 个 数据 库 项 目 。 
我 们 将 使 用 图 表 的 方式 示范 如 何在 数据 库 系 统 开 发 生命 周期 的 前 期 阶段 ( 即 数据 库 规划 、 系 
统 定义 和 需求 收集 与 分 析 阶 段 ) 使 用 实况 发 现 技 术 以 及 生成 相应 文档 。 
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11.4.1 DreamHome 案例 研究 一 一 概述 


1992 年 ，DreamHome 在 英国 的 格拉 斯 哥 (Glasgow) 的 第 一 家 分 公司 开业 。 从 那 以 后 ， 
这 家 公司 稳步 发 展 ， 目 前 其 分 公司 已 经 过 布 英国 大 多 数 的 主要 城市 ， 甚 至 同一 个 城市 拥有 几 
家 分 公司 。 然 而 ， 随 着 公司 规模 的 扩大 ， 需 要 聘用 越 来 越 多 的 员工 处 理 日 益 增 长 的 大 量 文案 
工作 。 更 糟糕 的 是 ， 即 使 是 在 同一 个 城市 里 ， 各 分 公司 之 间 也 缺乏 信息 交流 和 信息 共享 。 公 
司 负责 人 Sally Mellweadows 察觉 到 已 经 有 太 多 的 错误 发 生 ， 如 果 她 不 及 时 采取 措施 挽救 现 
状 的 话 ， 公 司 的 成 功 将 不 会 太 长 久 。Sally 认为 数据 库 可 以 解决 一 部 分 问题 ， 并 因此 提出 开 
发 一 个 数据 库 系 统 以 文 持 DreamHome 的 运作 。 她 简要 摘 述 了 DreamHome 通常 的 运作 方式 。 

DreamHome 专门 从 事 房地产 管理 ， 在 希望 出 租房 屋 的 业主 和 需要 租赁 房屋 的 客户 之 间 
担当 中 介 DreamHome 目前 拥有 100 个 分 公司 ， 大 约 有 2000 名 员工 。 当 有 新 员工 进入 公司 
工作 时 ， 需 要 填写 DreamHome 员工 注册 表 。Susan Brand 填写 的 员工 注册 表 如 图 11-1 所 示 。 


Staff Number SG5 Branch Number B003 


Full Name Susan Brand Branch Address 
163 Main St, Glasgow 
Telephone Number(s) 
0141-339-2178 / 0141-359-4433 


Sex F DOB 34-Jun-70 


Manager Start Date 01-Jun-99 
Manager Bonus 2350 





图 11-1 Susan Brand 的 pombe 员工 登记 表 
每 个 分 公司 都 拥有 一 定数 量 和 不 同 职位 的 员工 ， 包 括 经 理 、 主 管 和 助理 。 经 理 负责 分 公 
司 的 日 常 运作 ， 每 个 主管 负责 管理 一 组 员工 ( 即 助 理 )。 图 11-2 是 在 格拉 斯 哥 某 分 公司 工作 
的 员工 个 人 信息 表 的 首页 。 





图 11-2 格拉斯哥 DreamHome 某 分 公司 员工 个 人 信息 表 的 首页 


258 BAD KEPED it 


每 个 分 公司 都 提供 一 些 可 供出 租 的 房屋 。 为 了 通过 DreamHome 出 租房 屋 ， 业 主 通常 会 
与 距离 他 要 出 租 的 房屋 最 近 的 DreamHome 分 公司 联系 。 业 主 提供 房屋 的 详细 信息 ， 并 同 分 
公司 的 经 理 就 该 房屋 的 租金 达成 协议 。 图 11-3 为 一 处 位 于 格拉 斯 哥 的 房屋 的 登记 表 。 


DreamHome 
Property Registration Form 


Owner Number C093 
(if known) 










Person/Business Name 
Tony Shaw 





Address 12 Fark 月 
Glasgow G4 OQR 











5 Novar Drive, 
Glasgow, G12 9AX 


Tel No 0141-225-7025 


Enter details where applicable 


11-3 ”位 于 格拉 斯 哥 的 一 处 房屋 的 登记 表 


一 旦 房屋 登记 完毕 ，DreamHome 就 会 提供 相应 的 服务 以 确保 房屋 被 租 出 ， 尽 可 能 给 业 
主 当 然 也 会 给 DreamHome 带 来 最 大 的 利润 。 这 些 服务 包括 与 可 能 的 租房 者 ( 即 客 户 ) 进行 
面谈 、 组 织 客户 查看 房屋 、 在 当地 或 国内 (必要 时 ) 的 报纸 上 刊登 广告 、 商 议 租 约 。 房 屋 一 
且 租 出 ，DreamHome 将 对 房屋 负责 ， 包 括 收 取 租 金 。 

那些 对 出 租房 屋 感 兴趣 的 人 须 先 与 距 其 最 近 的 DreamHome 分 公司 联系 ， 注 册 成 为 
DreamHome 的 客户 。 但 是 ， 在 成 功 注册 之 前 ， 员 工 通 常会 与 这 一 未 来 客户 进行 面谈 ， 以 记录 
下 他 的 详细 信息 及 其 在 租房 需求 方面 的 偏好 。 图 11-4 是 一 个 叫 Mike Ritchie 的 客户 的 登记 表 。 


DreamHome 
Client Registration Form 


Client Number CR74 Branch Number 6003 
(Enter if known) Te E a 














163 Main St, Glasgow 





Full Name 





Mike Ritchie 


Registered By 
Ann Beech 








Enter property requirements 















Type flat 


Date Registered 16-Nov-11 
Max Rent 790 





图 11-4 DreamHome 客户 Mike Ritchie 的 客户 登记 表 
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一 旦 客户 注册 成 功 ， 每 周 他 都 会 收 到 一 份 表 单 ， 上 面 列 出 了 当前 可 以 出 租 的 所 有 房屋 的 
信息 。 图 11-5 是 格拉 斯 哥 某 分 公司 为 客户 提供 的 这 份 表单 的 首页 。 


DreamHome 
Property Listing for Week beginning 01/06/13 


If you are interested in viewing or renting any of the properties in this 
list, please contact our branch office as soon as possible. 










Branch Address Telephone Number(s) 
163 Main St, Glasgow 0141-339-2178 | 0141-339-4439 
G11 9QX 


C7 od [eer 


6 Lawrence St, Glasgow 
2 Manor Rd, Glasgow 

18 Dale Road, Glasgow 
5 Novar Drive, Glasgow 


图 11-5 格拉 斯 哥 某 分 公司 DreamHome 可 出 租房 屋 报表 的 首页 


客户 可 能 会 要 求 从 列表 中 选择 一 处 或 几 处 房产 实地 查看 ， 之 后 客户 一 般 都 会 对 这 些 房产 
的 适宜 性 做 出 评论 。 客 户 对 格拉 斯 哥 某 处 房产 的 评论 意见 表 的 首页 如 图 11-6 所 示 。 至 于 那 
些 难于 租 出 的 房产 ， 通 常会 在 当地 或 国内 的 报纸 上 刊登 广告 。 


1411/13 
"1713 





图 11-6 “格拉 斯 哥 某 处 房产 的 DreamHome 客户 查看 意见 表 的 首页 


当 客 户 确定 了 满意 的 房屋 后 ， 就 由 一 名 员工 起 草 一 份 租 约 。 客 户 Mike Ritchie 租 住 格拉 
斯 哥 某 房屋 的 租约 如 图 11-7 所 示 。 

在 租 期 快 满 的 时 候 ， 客 户 可 能 会 要 求 续 租 ， 即 使 是 续 租 也 需要 重新 起 草 一 份 新 的 租约 。 
或 者 ， 客 户 也 可 能 要 求 查看 为 外 的 房产 。 
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Full Name 
(Please print) 


Client Signature 


Enter payment details 
Monthly Rent 450 
Payment Method Cheque 
Deposit Paid (Y or N) Yes 


RUE DA FIR FF 


DreamHome Lease 
Number 00345810 


Client Number CR74 Property Number PGIG 
(Enter if known) 





Property Address 
5 Novar Dr, Glasgow 





Mike Ritchie 






Rent Start 01/06/12 






Rent Finish 31/05/15 







Duration | year 


图 11-7 Mike Ritchie 租 住 格拉 斯 哥 某 房屋 的 Dreamhome 租约 表单 


11.4.2 DreamHome 案例 研究 一 一 数据 库 规划 


开发 数据 库 系统 的 第 一 步 就 是 要 为 数据 库 项 目 清晰 地 定义 任务 描述 。 任 务 描 述 定义 了 数 
据 库 系统 的 主要 目的 。 一 旦 生成 任务 描述 ， 下 一 步 就 是 确定 任务 目标 。 任 务 目标 应 该 明确 数 
据 库 系统 必须 支持 的 详细 任务 。 
为 DreamHome 数据 库 系 统 定 义 任务 描述 

我 们 从 与 公司 负责 人 和 负责 人 指定 的 员工 会 谈 开 始 ， 拉 开 为 DreamHome 数据 库 系 统 定 
义 任务 描述 的 序幕 。 在 这 一 阶段 通常 最 有 用 的 问题 是 开放 式 问题 。 这 一 类 的 典型 问题 包括 : 

e 公司 的 目标 是 什么 ? 

e 为 什么 您 认为 需要 一 个 数据 库 ? 

© 您 认为 数据 库 将 怎样 解决 你 们 过 到 的 问题 ? 

例如 ， 数 据 库 开发 人 员 可 以 就 DreamHome 对 负责 人 提出 下 列 问题 : 


数据 库 开 发 人 员 : 
RBA: 


数据 库 开 发 人 员 : 
负责 人 : 


数据 库 开 发 人 员 : 
负责 人 : 


公司 的 目标 是 什么 ? 

对 于 已 经 在 英国 各 分 公司 注册 而 成 为 我 们 客户 的 人 ， 我 们 将 提供 大 量 
的 、 高 质量 的 竺 租房 屋 。 我 们 出 租 高 质量 房屋 的 能 力 取决 于 我 们 为 业 
主 提 供 服务 的 能 力 。 我 们 能 够 为 业主 提供 高 度 专业 的 服务 ， 以 确保 房 
屋 以 最 大 利润 出 租 。 

为 什么 您 认为 需要 一 个 数据 库 ? 

说 实话 ， 我 们 已 经 无 法 应 对 成 功 带 来 的 问题 。 在 过 去 的 几 年 里 ， 我 们 在 英 
国 大 多 数 主 要 的 城市 都 建立 了 分 公司 ， 每 个 分 公司 都 在 为 不 断 增 多 的 
客户 提供 着 大 量 的 可 供出 租 的 房屋 。 但 是 ， 伴 随 着 成 功 而 来 的 是 不 断 
增多 的 数据 管理 问题 ， 这 就 意味 着 我 们 提供 的 服务 的 水 准 正 在 下 降 。 
同时 ， 分 公司 之 间 缺 乏 合作 与 信息 共 蝇 ， 这 是 一 个 非常 令 人 担忧 的 发 
展 趋势 。 

您 认为 数据 库 将 怎样 解决 你 们 遇 到 的 问题 ? 

据 我 所 知 ， 我 们 淹没 在 了 大 量 的 文案 工作 中 。 因 此 需要 一 种 能 够 提高 
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工作 效率 的 东西 ， 使 得 这 些 日 子 里 许多 看 似 永远 也 做 不 完 的 日 常 工作 
目 动 完成 。 同 时 ， 我 也 希望 各 分 公司 能 够 协同 工作 。 数 据 库 将 有 助 于 
实现 这 一 切 ， 对 吗 ? 
对 这 类 问题 的 回答 将 有 助 于 阐明 任务 描述 。DreamHome 数据 库 系 统 的 任务 描述 如 
图 11-8 所 示 。 当 有 了 一 个 清晰 、 明 确 并 且 DreamHome 员工 也 认可 的 任务 描述 以 后 ,我们 
继续 进行 任务 目标 的 定义 。 


数据 库 系统 DreamHome 的 用 途 是 维护 房屋 租赁 业务 中 使 用 和 产生 的 关于 
客户 和 房 主 的 数据 ， 并 方便 各 分 公司 间 协 作 和 共享 信息 。 





图 11-8 DreamHome 数据 库 系统 的 任务 描述 


为 DreamHome 数据 库 系 统 定义 任务 目标 
定义 任务 目标 的 过 程 中 涉及 与 相关 员工 的 面谈 。 同 样 ， 在 这 一 阶段 通常 最 有 用 的 依然 是 
开放 式 问 题 。 为 了 获得 完整 的 任务 目标 ， 我 们 需要 和 Dreamhome 中 担任 不 同 角 色 的 员工 进 
行 面谈 。 典 型 的 问题 包括 : 
e 请 描述 一 下 您 的 工作 。 
© 通常 您 每 天 都 会 从 事 哪些 工作 ? 
您 处 理 哪 些 数据 ? 
您 要 用 到 哪些 类 型 的 报表 ? 
您 需要 跟踪 记录 哪些 事情 ? 
e 您 的 公司 为 客户 提供 了 哪些 服务 ? 
在 与 DreamHome 的 负责 人 以 及 其 他 员工 (包括 经 理 、 主 管 和 助理 等 角色 的 员工 ) 面谈 
时 会 提出 上 述 (或 类 似 的 ) 问题 。 根 据 需要 ， 可 能 有 必要 对 问题 做 出 调整 ， 这 取决 于 面谈 的 
对 象 。 
负责 人 
数据 库 开 发 人 员 : 您 在 公司 担任 什么 角色 ? 
负责 人 : 我 监督 整个 公司 的 运转 ， 并 确保 公司 能 够 持之以恒 地 为 客户 和 业主 提 
供 最 好 的 房屋 租赁 服务 。 
数据 库 开 发 人 员 : 通常 您 每 天 都 会 从 事 哪 些 工 作 ? 
负责 人 : 我 通过 经 理 来 监控 每 个 分 公司 的 运转 ， 试 图 确保 所 有 的 分 公司 都 能 够 
很 好 地 协同 工作 ， 能 够 共享 与 房屋 和 客户 有 关 的 重要 信息 。 我 通常 
都 会 坚持 每 个 月 在 分 公司 经 理 们 的 障 同 下 在 各 个 分 公司 高 调 亮 相 一 
两 次 。 
数据 库 开 发 人 员 : 您 需要 处 理 哪些 数据 ? 
负责 人 : 我 需要 了 解 所 有 的 信息 ， 至 少 是 DreamHome 使 用 过 的 或 新 产生 的 各 
种 数据 的 摘要 ， 包 括 : 所 有 分 公司 的 员工 、 所 有 的 房屋 和 业主 、 所 有 
的 客户 、 所 有 的 租约 。 我 也 会 关注 都 有 哪些 分 公司 在 报纸 上 刊登 了 出 
租 广告 。 
数据 库 开发 人 员 : 您 会 用 到 哪些 类 型 的 报表 ? 
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负责 人 : 


数据 库 开 发 人 员 : 
负责 人 : 
数据 库 开 发 人 员 : 
负责 人 : 


经 理 


数据 库 开 发 人 员 : 
经 理 : 


数据 库 开 发 人 员 : 
经 理 : 


数据 库 开发 人 员 : 
经 理 : 


数据 库 开 发 人 员 : 
经 理 : 


数据 库 开 发 人 员 : 
经 理 : 
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我 需要 了 解 所 有 分 公司 的 现状 ， 可 是 分 公司 太 多 了 。 我 要 花费 大 量 的 工作 
日 仔细 查看 DreamHome 所 有 方面 的 宛 长 的 报表 。 我 希望 这 些 报表 容易 
阅读 ， 并 且 可 以 帮助 我 很 好 地 纵览 某 个 分 公司 或 者 所 有 分 公司 的 业务 。 
您 需要 跟踪 记录 哪些 事情 ?、 

如 同 我 前 面 说 过 的 ， 我 需要 纵览 所 有 的 情况 ， 我 需要 掌握 全 局 。 

您 的 公司 为 客户 提供 了 哪些 服务 ? 

我 们 试图 提供 全 英国 最 好 的 房屋 租赁 服务 。 


请 描述 一 下 您 的 工作 。 

我 的 职位 是 经 理 。 我 负责 掌控 我 所 在 的 分 公司 的 日 常 运作 ， 并 为 我 们 
的 客户 和 业主 提供 最 好 的 房屋 租赁 服务 。 

通常 您 每 天 都 会 从 事 哪些 工作 ? 

我 要 保证 分 公司 在 任何 时 间 都 有 一 定数 量 、 不 同 角 色 的 员工 在 位 。 我 
负责 监控 新 房产 和 新 客户 的 登记 注册 ， 以 及 当前 活跃 客户 的 租赁 活 
动 。 我 有 责任 确保 分 公司 能 够 为 客户 提供 足够 数量 和 类 型 的 房产 。 我 
有 时 也 会 参与 高 档 房 屋 租约 的 协商 ， 但 是 由 于 工作 量 的 关系 ， 我 经 常 
会 把 这 项 工作 委派 给 主管 。 

您 处 理 哪些 数据 ? 

我 工作 中 接触 的 大 部 分 都 是 与 我 分 公司 的 竺 出租 房屋 、 业 主 、 客 户 和 
租约 有 关 的 数据 。 我 还 需要 在 房屋 难以 出 租 时 及 时 掌握 情况 ， 并 据 此 
安排 把 这 些 房产 的 出 租 信息 刊登 在 报纸 广告 上 。 之 所 以 要 密切 关注 这 
方面 的 信息 ， 是 因为 广告 费用 昂贵 。 我 还 需要 查询 在 我 分 公司 和 其 他 
本 地 分 公司 工作 的 员工 的 数据 。 这 是 因为 ， 我 有 时 需要 联系 其 他 的 分 
公司 以 安排 管理 层 会 议 ， 或 者 需要 借调 其 他 分 公司 的 员工 ， 以 解决 我 
分 公司 员工 由 于 生病 或 度假 而 造成 的 短期 人 手 不 足 。 这 种 在 本 地 不 同 
分 公司 之 间 的 员工 借调 是 非 正 式 的 ， 令 人 欣慰 的 是 并 不 经 常 发 生 。 除 
了 与 员工 有 关 的 数据 外 ， 如 果 还 能 够 看 到 其 他 分 公司 的 各 种 数据 ， 包 
括 待 出 租房 屋 、 业 主 、 客 户 以 及 租约 等 信息 ， 这 将 对 我 们 大 有 神 益 ， 
我 们 可 以 对 这 些 数据 加 以 分 析 比 较 。 实 际 上 ， 我 想 公司 的 负责 人 一 定 
希望 这 个 数据 闫 项 目 将 会 有 助 于 提高 各 个 分 公司 之 间 的 协同 合作 和 信 
息 共 享 。 但 是 ,我 认识 的 某 些 分 公司 的 经 理 却 并 不 热衷 于 此 ， 因 为 他 
们 认为 彼此 处 于 竞争 的 态势 。 部 分 原因 是 在 经 理 的 薪水 中 ， 奖 金 是 占 
有 一 定 比 例 的 ， 而 奖金 的 多 少 取决 于 我 们 能 够 租 出 去 房产 的 多 少 。 

您 要 用 到 哪些 类 型 的 报表 ? 

我 需要 与 员工 、 房 产 、 业 主 、 客 户 和 租约 有 关 的 各 种 报表 。 我 需要 一 
桨 之 下 就 能 知道 哪些 房屋 需要 出 租 以 及 客户 想 要 的 是 什么 。 

您 需要 跟踪 记录 哪些 事情 ? 

我 需要 跟踪 了 解 员工 的 薪水 。 我 需要 追踪 在 我 分 公司 登记 的 房产 的 已 
出 租 情况 以 及 何 时 需要 续 约 。 我 还 需要 密切 关注 在 报纸 上 刊登 广告 的 
费用 支出 。 


数据 库 开 发 人 员 : 
经 理 : 


数据 库 开发 人 员 : 
ER: 


数据 库 开 发 人 员 : 
主管 : 


数据 库 开发 人 员 : 
主管 : 


数据 库 开 发 人 员 : 
主管 : 
数据 库 开 发 人 员 : 
主管 : 


数据 库 开 发 人 员 : 
助理 : 
数据 库 开 发 人 员 : 
助理 : 


数据 库 开发 人 员 : 
助理 : 
数据 库 开 发 人 员 : 
助理 : 


BILF KEFDAHS DreamHome FHF 263 


您 的 公司 为 客户 提供 哪些 服务 ? 

要 知道 我 们 有 两 种 类 型 的 客户 : 想 要 租赁 房屋 的 客户 以 及 房产 业主 。 
我 们 要 确保 客户 无 需 多 跑腿 就 能 快速 地 找到 他 们 期 望 的 房屋 ， 并 且 租 
金 合 理 。 当 然 ， 业 主 也 无 需 多 费 层 舌 就 可 从 他 们 出 租 的 房产 中 获得 丰 
厚 的 利润 。 


请 描述 一 下 您 的 工作 。 

我 的 职位 是 主管 。 我 大 部 分 的 时 间 都 会 在 办 公 室 里 直接 与 客户 打 交 
道 ， 包 括 想 要 租赁 房屋 的 人 和 房产 业主 。 我 还 要 对 一 个 小 组 的 员工 
( 即 助 理 们 ) 负责 ， 并 确保 他 们 总 是 处 在 忙碌 的 工作 状态 而 不 是 在 偷 
懒 ， 但 这 并 不 成 问题 ， 因 为 我 们 总 有 大 量 的 工作 要 做 ， 事 实 上 这 些 工 
作 永 远 也 没有 尽头 。 

通常 您 每 天 都 会 从 事 哪些 工作 ? 

通常 我 会 从 为 员工 分 配 不 同 的 任务 开始 一 天 的 工作 ， 这 些 任务 包括 与 
客户 或 业主 打交道 、 组 织 客户 查看 房产 以 及 整理 文档 。 当 客户 找到 合 
适 的 房屋 后 ， 我 负责 起 草 租 约 ， 但 是 在 签名 之 前 ， 经 理 必 须 认 可 这 份 
文档 。 我 负责 更 新 客户 的 详细 资料 以 及 为 那些 想 要 成 为 我 们 公司 客户 
的 员工 注册 。 当 新 的 房产 信息 完成 登记 后 ， 经 理 将 会 把 该 房产 的 管理 
权 分 配给 我 或 者 其 他 的 主管 或 助理 。 

您 需要 处 理 哪些 数据 ? 

我 工作 中 接触 的 数据 包括 本 分 公司 的 员工 、 房 产 、 业 主 、 客 户 、 房 产 
评论 和 租约 。 

您 要 用 到 哪些 类 型 的 报表 ? 

关于 员工 和 房屋 出 租 的 报表 。 

您 需要 跟踪 记录 哪些 事情 ? 

我 需要 知道 有 哪些 房屋 是 可 以 出 租 的 以 及 目前 有 哪些 租约 将 要 到 期 。 
我 还 要 了 解 客 户 都 需要 什么 。 我 要 使 得 经 理 能 够 掌握 所 有 难以 租 出 的 
房屋 的 最 新 动态 。 


请 描述 一 下 您 的 工作 。 

我 的 职位 是 助理 ， 直 接 与 客户 打交道 。 

通常 您 每 天 都 会 从 事 哪些 工作 ? 

我 要 回答 客户 关于 房屋 出 租 的 各 种 二 般 性 问题 ， 比 如 “你 们 这 儿 有 位 
于 格拉 斯 哥 某 一 地 区 的 这 样 的 或 这 种 类 型 的 房屋 出 租 吗 ?” 我 还 为 新 
的 客户 进行 注册 ,负责 安排 客户 查看 房产 。 不 太 忙 的 时 候 ， 我 还 要 整 
理 文档 ， 我 讨厌 这 项 工作 ， 太 烦人 了 了。 

您 需要 处 理 哪 些 数据 ? 

我 工作 中 接触 的 数据 包括 房产 和 客户 对 房屋 的 评论 ， 有 时 还 有 租约 。 
您 要 用 到 哪些 类 型 的 报表 ? 

可 供出 租 的 房屋 的 清单 ， 并 且 需 要 每 星期 更 新 一 次 。 
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数据 库 开发 人 员 : 


您 需要 跟踪 记录 哪些 事情 ? 


助理 : 条 些 房屋 是 否 可 以 租 出 去 ,哪些 客户 还 在 找 房子 住 。 


数据 库 开 发 人 员 : 


您 的 公司 为 客户 提供 了 哪些 服务 ? 
助理 : 我 们 需要 回答 客户 关于 可 供出 租 的 房屋 的 各 种 问题 ， 


例如 “在 格拉 斯 


ay AYRE R= (Hyndland) 区 是 和 否 有 带 两 个 卧室 的 公寓 ?” 以 及 “在 市 中 
心 带 有 一 个 卧室 的 公寓 的 租金 大 概 是 多 少 ?” 


对 这 些 问 题 的 回答 ， 可 以 帮助 我 们 确定 
任务 目标 。DreamHome 数据 库 系 统 的 任务 
目标 如 图 11-9 所 示 。 


11.4.3 DreamHome 案例 研究 一 一 系 
统 定义 

系统 定义 阶段 的 目的 是 确定 数据 库 系 统 
的 范围 、 边 界 以 及 主要 的 用 户 视 图 。 在 10.4 
pH, 我们 讲述 了 用 户 视 图 怎样 表示 数据 库 
系统 应 该 支撑 的 需求 ， 这 些 需 求 的 提出 或 者 
来 自 不 同 的 用 户 角 色 (如 公司 负责 人 或 者 主 
E), 或 者 来 自 不 同 的 业务 应 用 领域 (如 房 
屋 租 赁 或 者 房地产 销售 )。 
定义 DreamHome 数据 库 系 统 的 系统 边界 

在 数据 库 系统 开发 生命 周期 的 这 一 阶 
段 ， 进 一 步 与 用 户 交 流 能 够 使 得 前 一 阶段 获 
取 的 数据 更 加 清晰 准确 ， 还 可 能 有 新 的 收 
获 。 另 外 ， 其 他 的 一 些 实况 发 现 技术 ， 比 如 
11.4.1 节 讲 到 的 分 析 文 档 资 料 等 技术 也 可 以 
在 这 一 阶段 使 用 。 迄 今 为 止 收 集 的 所 有 资料 
经 过 分 析 就 可 以 用 来 定义 数据 库 系 统 的 边界 
了 。DreamHome 数据 库 系 统 的 系统 边界 定 
义 如 图 11-10 所 示 。 


维护 (录入 、 更 新 和 删除 ) 关于 分 公司 的 数据 。 
维护 (录入 、 更 新 和 删除 ). 关 于 员工 的 数据 。 
维护 ( 录入、 更 新 和 删除 ) 关于 待 出 租房 产 的 数据 。 
维护 ( 录入、 更 新 和 删除 ) 关于 房产 业主 的 数据 。 
维护 ( 录入 、 更 新 和 删除 ) 关于 客户 的 数据 。 
维护 ( 录入、 更 新 和 删除 ) 关于 看 房 的 数据 。 
维护 ( 录入、 更 新 和 删除 ) 关于 租约 的 数据 。 
维护 (录入 、 更 新 和 删除 ) 关于 报纸 广告 的 数据 。 


执行 关于 分 公司 的 查询 。 
于 员 


执行 关于 报纸 广告 的 查询 。 


查看 待 出 租房 产 的 状态 。 
查看 希望 租房 的 客户 的 状态 。 
查看 租约 的 状态 。 


产生 关于 分 公司 的 报表 。 
产生 关于 员工 的 报表 。 
产生 关于 待 出 租房 产 的 报表 。 
产生 关于 房产 业主 的 报表 。 
产生 关于 客户 的 报表 。 
产生 关于 看 房 的 报表 。 
产生 关于 租约 的 报表 。 
产生 关于 报纸 广告 的 报表 。 





图 11-9 DreamHome 数据 库 系统 的 任务 目标 





系统 边界 
图 11-10 DreamHome 数据 库 系 统 的 系统 边界 
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确定 DreamHome 数据 库 系 统 的 主要 用 户 视 图 

我 们 通过 对 已 经 获取 的 数据 进行 分 析 ， 就 可 以 定义 数据 库 系 统 的 主要 用 户 视图 。 与 用 户 
视图 有 关 的 大 多 数 资料 ， 来自 与 公司 负责 人 和 担任 经 理 、 主 管 和 助理 等 各 种 角色 的 员工 面谈 
的 结果 。DreamHome 数据 库 系统 的 主要 用 户 视图 如 图 11-11 所 示 。 





BB} EN ea 经 客户 
所 有 分 公司 ee BERENA Pee a! 
aR ee 
Sa LR ES 
单个 分 公司 SE EEEE 
UP Ca at 
让 
所 有 员工 arb Wu Dba 
a et Cee 
We rida 
分 公司 员工 tb 
a 7 Sera 
i ee ee aad 
TE TT 


所 有 房产 
eS 
所 有 业主 
ea 
所 有 客户 
= 


所 有 看 房 情况 










分 公司 看 房 情况 


所 有 租约 


分 公司 租约 


所 有 报纸 广告 


分 公司 报纸 广告 


图 11-11 DreamHome 数据 库 系统 的 主要 用 户 视图 
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11.4.4 DreamHome 案例 研究 一 一 需求 收集 与 分 析 


在 这 一 阶段 ,我们 继续 为 前 一 阶段 确定 的 用 户 视图 收集 更 多 的 细节 信息 ， 以 定义 用 户 需 
求 规格 说 明 书 。 用 户 需 求 规格 说 明 书 详细 说 明了 数据 库 中 所 存储 的 数据 以 及 这 些 数据 的 使 用 
方法 。 在 收集 这 些 资料 的 同时 ， 还 应 收集 所 有 对 系统 提出 的 一 般 性 需求 ， 以 生成 系统 规范 。 
系统 规范 中 包括 了 所 有 新 的 数据 系统 应 该 具备 的 特性 ， 比 如 是 否 文 持 网 络 或 者 共享 访问 需 
求 、 性 能 需求 以 及 需要 设置 的 安全 级 别 。 
在 为 新 系统 收集 与 分 析 这 些 需求 期 间 ， 也 会 了 解 到 现 有 系统 中 最 有 用 的 和 最 有 问题 的 那 
些 特性 。 在 开发 新 的 数据 库 系统 时 ， 在 为 新 的 系统 引入 一 些 能 够 提高 效益 (这 本 来 就 是 使 用 
新 系统 的 目的 之 一 ) 的 举措 时 ， 尽 量 保留 当前 系统 中 好 的 东西 不 失 为 一 种 明智 的 做 法 。 
与 这 一 阶段 相关 的 一 项 重要 活动 就 是 要 确定 如 何 处理 多 个 用 户 视 图 。 就 像 我 们 在 10.6 
节 讨 论 的 那样 ， 有 三 种 主要 的 方法 可 以 用 来 处 理 多 个 用 户 视 图 : 集中 式 方 法 、 视 图 集成 方法 
和 两 种 方法 的 混合 使 用 。 下 面 简要 讨论 如 何 使 用 这 些 方法 。 
为 DreamHome 数据 库 系 统 的 用 户 视 图 收集 更 多 的 信息 
为 了 掌握 与 每 个 用 户 视图 需求 相关 的 更 多 资料 ， 可 以 再 次 选用 一 种 实况 发 现 技术 ， 比 如 
面谈 或 者 观察 企业 的 运作 。 对 于 某 个 用 户 视 图 所 需 信 息 (用 XX 表示)， 我 们 可 以 这 样 提问 : 
e 您 需要 掌握 关于 X 的 哪些 类 型 的 数据 ? 
e 您 会 对 与 X 有 关 的 数据 做 哪些 事情 ? 
在 下 面 的 提问 示例 中 ， 可 以 这 样 询问 经 理 。 
数据 库 开 发 人 员 : 您 需要 掌握 员工 的 哪些 资料 ? 
经 理 : 员工 的 全 名 、 职 位 、 性 别 、 生 日 以 及 薪水 。 
数据 库 开发 人 员 : 您 通常 做 的 哪些 事情 是 与 员工 的 信息 有 关 的 ? 
经 理 : 我 需要 能 够 输入 新 员工 的 个 人 资料 ， 并 在 其 离开 公司 后 删除 他 们 的 信 
居 。 我 需要 及 时 更 新 员工 的 个 人 资料 ， 并 且 能 够 以 报表 形式 打印 出 我 
分 公司 员工 的 信息 ， 这 些 信 息 包 括 员 工 的 全 名 、 职 位 和 工资 。 我 还 可 
以 为 员工 指派 其 主管 。 有 时 候 ， 当 我 需要 和 其 他 分 公司 联系 时 ， 我 能 
够 查 到 那 家 分 公司 经 理 的 名 字 和 电话 号 码 。 
对 数据 库 储 存 的 所 有 重要 数据 ， 都 要 进行 类 似 的 询问 。 对 这 些 问 题 的 回答 有 助 于 确定 用 
户 需求 规格 说 明 书 中 的 必要 细节 。 
为 DreamHome 数据 库 系 统 的 系统 需求 收集 信息 
在 为 用 户 视图 定义 获取 数据 而 进行 的 面谈 中 ， 我 们 也 要 为 系统 需求 收集 更 多 的 细节 信 
上 县。 关于 系统 ， 我 们 可 以 提出 下 列 问题 : 
e 数据 库 中 执行 最 频繁 的 事务 是 什么 ? 
对 于 企业 来 说 ， 哪 些 事 务 最 关键 ? 
这 些 关 键 性 事务 在 什么 时 间 被 执行 ? 
关键 性 事务 的 低 发 、 正 常 和 高 峰 时 段 分 别 是 什么 时 候 ? 
您 希望 数据 库 系 统 具备 什么 样 的 安全 性 ? 
是 否 存在 高 度 敏 感 的 数据 ， 这 些 数 据 只 能 被 某 些 员工 访问 ? 
您 希望 保存 哪些 历史 数据 ? 
数据 库 系统 的 网 络 访问 需求 和 共享 访问 需求 是 什么 ? 
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© 当 系 统 故障 或 数据 丢失 的 时 候 ， 您 布 望 数据 库 系 统 具有 什么 样 的 保护 措施 ? 
我 们 可 以 这 样 对 经 理 提 问 。 


数据 库 开 发 人 员 : 
经 理 : 


数据 库 开发 人 员 : 
经 理 : 


数据 库 开发 人 员 : 
经 理 : 
数据 库 开 发 人 员 : 
经 理 : 


数据 库 中 执行 最 频繁 的 事务 是 什么 ? 

我 们 经 常 接 到 客户 的 电话 咨询 ， 或 者 客户 直接 来 公司 咨询 ， 咨 询 内 容 
不 外 乎 在 某 个 城市 的 某 个 地 区 是 否 有 某 种 类 型 的 房屋 可 以 出 租 ， 并 且 
租金 不 要 超过 某 个 额度 。 我 们 还 要 及 时 更 新 出 租房 产 和 客户 的 信息 ， 
这 样 打印 出 来 的 报表 中 就 能 正确 显示 所 有 当前 可 以 出 租 的 房屋 信息 以 
REP A FASE Al o 

在 您 的 业务 范围 内 ， 哪 些 事务 最 为 关键 ? 

关键 性 的 事务 包括 对 特定 房产 的 搜索 ， 能 够 报表 打印 最 新 的 可 以 出 租 
的 房屋 列表 。 如 果 连 这 些 最 基本 的 服务 都 无 法 提供 的 话 ， 我 们 的 客户 
将 会 流失 。 

这 些 关键 性 事务 在 什么 时 间 被 执行 ? 

每 天 。 

关键 性 事务 的 低 发 、 正 常 和 高 峰 时 段 分 别 是 什么 时 候 ? 

我 们 一 星期 营业 六 天 。 一 般 来 说 ， 早 上 是 比较 轻松 的 ， 但 随 着 时 间 的 
推移 会 越 来 越 忙 。 每 天 处 理 客户 业务 最 忙 的 时 间 段 是 : 上 午 12 点 到 
下 午 2 点 和 下 午 5 点 到 晚上 7 点 。 


可 以 对 公司 负责 人 提出 以 下 问题 。 


数据 库 开发 人 员 : 
负责 人 : 


数据 库 开 发 人 员 : 
RBA: 


数据 库 开 发 人 员 : 
负责 人 : 


数据 库 开 发 人 员 : 
负责 人 : 


您 希望 数据 库 系 统 具 备 什 么 样 的 安全 性 ? 

尽管 我 并 不 认为 对 于 一 家 房屋 租赁 公司 的 数据 库 系 统 来 说 ， 数 据 库 里 
会 存储 什么 非常 敏感 的 数据 ， 但 是 ， 我 还 是 不 希望 竞争 对 手 能 够 看 到 
我 公司 的 房产 、 业 主 、 客 户 和 租约 的 资料 。 员 工 应 该 只 能 以 表单 的 形 
式 看 到 其 工作 必需 的 数据 。 例 如 ， 尽 管 有 必要 让 主管 和 助理 都 能 看 到 
客户 的 详细 资料 ， 但 是 客户 的 记录 只 能 一 次 显示 一 个 ， 并 且 不 能 生成 
报表 。 

是 否 存在 高 度 敏 感 的 数据 ， 这 些 数据 只 能 被 某 些 员工 访问 ? 

正如 我 前 面 所 说 的 ， 员 工 应 该 只 能 看 到 工作 所 必需 的 那些 数据 。 比 如 
说 ， 尽 管 主管 需要 手下 员工 的 资料 ， 但 是 并 不 应 该 包括 员工 的 薪水 。 
您 布 望 保存 哪些 历史 数据 ? 

我 想 在 客户 和 业主 最 后 一 次 和 我 们 做 生意 之 后 的 两 年 时 间 里 ， 都 保留 
他 们 的 资料 。 这 样 我 们 可 以 给 他 们 邮寄 广告 ， 告 之 我 们 最 新 的 服务 ， 
通常 的 目的 就 是 把 他 们 重新 拉 回 来 。 我 也 想 多 保留 两 年 租约 的 资料 ， 
这 样 我 们 就 可 以 进行 统计 分 析 ， 从 而 发 现 诸如 每 个 城市 哪些 类 型 的 房 
产 和 地 段 对 房屋 租赁 市 场 来 说 是 最 抢手 的 等 结论 。 

数据 库 系 统 的 网 络 访 问 需求 和 共享 访问 需求 是 什么 ? 

我 布 望 所 有 的 分 公司 都 能 和 我 们 位 于 格拉 斯 哥 的 总 部 联网 ， 这 样 不 管 
何 时 何 地 ， 当 需要 时 ， 员工 就 能 访问 这 个 系统 。 我 希望 允许 大 多 数 分 
公司 的 两 到 三 名 员工 能 够 同时 访问 这 个 系统 ,但 别 忘 了 我 们 拥有 将 近 
100 个 分 公司 。 所 以 大 部 分 的 时 间 里 ， 员 工 应 该 只 需要 访问 本 分 公司 
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的 数据 。 但 是 ， 我 真 的 不 希望 对 系统 的 访问 次 数 和 访问 时 间 做 任何 的 
限制 ， 除 非 这 会 引发 经 费 问题 。 
数据 库 开 发 人 员 : 当 系 统 故障 或 数据 丢失 的 时 候 ， 您 希望 数据 库 系 统 提 供 什 么 样 的 保护 
措施 ? 
A: 当然 是 最 好 的 保护 措施 。 我 们 所 有 的 商业 活动 都 会 用 到 这 个 数据 库 ， 
所 以 如 果 它 出 了 问题 ， 我们 也 完蛋 了 (开玩笑 )。 我 们 继续 谈 正 事 ， 
我 认为 我 们 也 许可 以 在 每 天 晚上 公司 下 班 之 后 进行 数据 备份 。 你 认 
为 呢 ? 
我 们 需要 就 系统 所 有 重要 的 方面 进行 类 似 的 谈话 。 对 这 些 问 题 的 回答 有 助 于 我 们 为 系统 
需求 规格 说 明 书 的 制定 明确 一 些 必要 的 细节 问题 。 
管理 DreamHome 数据 库 系统 的 用 户 视图 
如 何 决定 到 底 是 使 用 集中 式 方法 、 视 图 集成 方法 还 是 混合 使 用 这 两 种 方法 呢 ? 一 种 帮助 
我 们 决策 的 方法 是 仔细 观察 在 系统 定义 阶段 生成 的 用 户 视 图 之 间 的 数据 重 又 程 度 。 表 11-7 
是 公司 负责 人 人、 经 理 、 主 管 、 助 理 和 客户 的 用 户 视图 与 每 个 视图 包括 的 主要 数据 类 型 的 对 
照 表 。 


负 


a 


表 11-7 用 户 视图 以 及 每 个 视图 使 用 的 主要 数据 类 型 的 对 照 表 
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从 表 11-7 中 可 以 看 出 ， 所 有 的 用 户 视图 所 涉及 的 数据 之 间 都 存在 着 一 定 程度 的 重合 。 
但 是 ,负责 人 和 经 理 的 用 户 视 图 之 间 、 主 管 和 助理 的 用 户 视 图 之 间 在 数据 需求 方面 表现 出 了 
更 多 的 相似 性 。 比 如 说 ， 只 有 人 负责 人 和 经 理 的 用 户 视 图 需要 关于 分 公司 和 报纸 的 数据 ， 而 只 
有 主管 和 助理 的 用 户 视 图 都 需要 房屋 评论 资料 。 客 户 用 户 视图 访问 的 数据 量 最 小 ， 仅 涉及 房 
产 和 客户 数据 。 基 于 这 些 分 析 ， 我 们 可 以 应 用 集中 式 方 法 先 将 负责 人 与 经 理 的 需求 合并 在 一 
起 ， 合 并 之 后 的 用 户 视图 称 为 Branch， 再 将 主管 、 助 理 和 客户 的 需求 合并 在 一 起 ， 命 名 为 
StaffClient。 然 后 ， 分 别 为 Branch 视图 和 StaffClient 视图 建立 与 之 对 应 的 数据 模型 ， 最 后 使 
用 视图 集成 方法 将 这 两 个 数据 模型 合并 。 

当然 ， 对 于 像 DreamHome 这 样 的 简单 案例 研究 ， 我 们 可 以 简单 地 对 所 有 的 视图 都 应 用 
集中 式 方 法 ， 但 是 我 们 依然 坚持 生成 两 个 聚合 的 视图 ， 这 样 就 可 以 在 第 17 章 详 细 讲 述 如 何 
应 用 视图 集成 的 方法 了 。 

对 于 什么 时 候 采用 集中 式 方 法 更 合适 ， 以 及 什么 时 候 使 用 视图 集成 方法 更 恰当 的 问题 ， 
很 难 给 出 明确 的 规则 。 究 竟 使 用 哪 种 方法 应 该 基于 对 数据 库 系统 的 复杂 性 的 评估 以 及 不 同 用 
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户 视 图 之 间 数 据 的 重 对 程度 。 然 而， 不 管 我 们 采用 的 是 集中 式 方法 、 视 图 集成 方法 还 是 混合 
方法 来 建立 底层 数据 库 ， 都 需要 为 最 终 得 到 一 个 可 运行 的 数据 库 重建 最 初 定义 的 用 户 视 图 
( 即 负责 人 、 经 理 、 主 管 、 助 理 和 客户 视图 )。 我 们 将 在 18 章 讲述 并 示范 数据 库 系 统 用 户 视 
图 的 建立 过 程 。 
至 此 ， 为 数据 库 系 统 的 每 一 个 用 户 视图 收集 的 所 有 信息 都 已 记录 在 用 户 需求 规格 说 明 书 
中 。 用 户 需 求 规格 说 明 书 列 出 了 每 一 个 用 户 视 图 的 数据 需求 并 给 出 了 用 户 视 图 对 这 些 数据 的 
操作 示例 。 为 了 便于 参考 ， 附 录 A 给 出 了 DreamHome 数据 库 系 统 的 用 户 需 求 规格 说 明 书 中 
的 Branch 和 Staff Client 视图 部 分 。 在 本 章 剩余 的 部 分 ， 将 给 出 DreamHome 数据 库 系 统 的 
系统 需求 概要 。 
DreamHome 数据 库 系 统 的 系统 规范 
系统 规范 应 该 列 出 Dreamhome 数据 库 系 统 中 所 有 的 重要 特性 。 这 些 特性 包括 : 
初始 数据 库 大 小 
数据 库 增 长 速度 
查询 记录 的 类 型 与 平均 查询 次 数 
网 络 及 共享 访问 需求 


备份 与 恢复 
法 律 问题 

DreamHome 数据 库 系 统 的 系统 需求 
初始 数据 库 大 小 

(1) 超过 100 家 的 分 公司 和 大 约 2000 名 员工 。 平 均 每 个 分 公司 拥有 20 名 员工 ， 最 多 不 
超过 40 名 员工 。 

(2) 公司 总 共 拥 有 大 约 100 000 处 可 以 出 租 的 房产 。 平 均 每 个 分 公司 1000 处 ， 最 多 不 
超过 3000 处 。 

(3) 大 概 有 60 000 位 业主 。 平 均 每 个 分 公司 600 位 ， 最 多 不 超过 1000 位 。 

(4) 公司 总 共 拥 有 100 000 个 左右 的 注册 客户 。 平 均 每 个 分 公司 1000 位 ， 最 多 不 超过 
1500 位 。 

(5) 总 共 拥 有 大 概 4 000 000 份 房产 评论 意见 表 。 平 均 每 个 分 公司 40 000 份 ， 最 多 不 超 
过 100 000 份 。 

(6) 公司 共有 大 约 400 000 份 租约 。 平 均 每 个 分 公司 4000 份 ， 最 多 不 超过 10 000 份 。 

(7) 总 共 在 100 家 报纸 上 刊登 了 大 约 50 000 个 广告 。 
数据 库 增 长 速率 

(1) 每 个 月 数据 库 中 大 约会 增加 500 处 新 的 房产 和 200 位 新 的 业主 。 

(2 ) 一 旦 某 处 房屋 不 再 出 租 后 ， 相 应 的 记录 将 会 从 数据 库 中 删除 。 每 个 月 大 约会 100 处 
房产 的 记录 被 删除 。 

(3) 如 果 一 位 业主 在 两 年 的 时 间 内 都 没有 可 供出 租 的 房屋 ， 那 么 他 的 记录 将 被 删除 。 每 
个 月 大 概 会 有 100 位 业主 的 记录 被 删除 。 

(4) 每 个 月 有 将 近 20 名 员工 加 入 和 离开 公司 。 离 开 公 司 一 年 之 后 ， 才 会 删除 该 员工 的 
记录 。 每 个 月 大 约会 有 20 名 员工 的 记录 被 删除 。 
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(5) 每 个 月 有 近 1000 名 新 客户 注册 。 如 果 一 位 客户 在 两 年 的 时 间 内 都 没有 查看 或 租 住 
房屋 ， 则 删除 他 的 记录 。 每 个 月 大 概 会 有 100 位 客户 的 记录 被 删除 。 

(6) 每 天 有 将 近 5000 份 新 的 房屋 意见 表 被 记录 。 记 录 将 会 在 一 年 之 后 被 删除 。 

(7 ) 每 个 月 会 签订 大 约 1000 份 新 租约 。 租 约 的 记录 将 会 在 生成 两 年 后 被 删除 。 

(8) 每 个 星期 将 会 在 报纸 上 刊登 大 约 1000 个 广告 ， 这 些 广告 的 记录 将 会 在 一 年 后 被 
删除 。 
查询 记录 的 类 型 与 平均 查询 次 数 

(1) 对 分 公司 详细 资料 的 查询 一 一 大 概 10 次 /天 。 

(2) 对 分 公司 员工 的 资料 的 查询 一 一 大 概 20 次 /天 。 

(3) 对 房产 的 详细 情况 的 查询 一 一 大 概 5000 次 /天 (星期 一 至 星期 四 )，10000 次 /天 
(星期 五 和 星期 六 )。 高 峰 时 间 为 12:00 ~ 14:00 和 17:00 ~ 19:00。 

(4) 对 业主 信息 的 查询 一 一 大 概 100 次 /天 。 

(5) 对 客户 详细 数据 的 查询 一 一 大 概 1000 次 /天 (星期 一 至 星期 四 )，2000 次 /天 (E 
期 五 和 星期 六 )。 高 峰 时 间 为 12:00 ~ 14:00 和 17:00 ~ 19:00. 

(6) 对 房屋 详细 意见 的 查询 一 一 大 概 2000 次 /天 (星期 一 至 星期 四 )，$ 000 次 /天 (E 
期 五 和 星期 六 )。 高 峰 时 间 为 12:00 ~ 14:00 和 17:00 ~ 19:00. 

(7 ) 对 租约 详细 信息 的 查询 一 一 1000 次 /天 (星期 一 至 星期 四 )，2000 次 /天 (星期 五 和 
星期 六 )。 高 峰 时 间 为 12:00 ~ 14:00 和 17:00 ~ 19:00. 
网 络 及 共享 访问 需求 

所 有 分 公司 都 能 够 安全 地 与 位 于 格拉 斯 哥 的 Dreamhome 总 部 的 中 心 数 据 库 联 网 。 系 统 
应 该 允许 来 自 同一 家 分 公司 的 两 到 三 名 员工 同时 并 发 地 访问 系统 。 对 于 并 发 访问 ， 必 须 考虑 
访问 许可 的 问题 。 
性 能 

(1 ) 在 非 高 峰 期 ， 对 所 有 单条 记录 查询 的 啊 应 时 间 应 小 于 1 秒 ; 高 峰 期 的 响应 时 间 应 小 
于 5 秒 。 

(2 ) 在 非 高 峰 期 ， 对 所 有 返回 多 条 记录 的 查询 的 响应 时 间 应 小 于 5 秒 ; 高 峰 期 的 响应 时 
间 应 小 于 10 秒 。 

(3 ) 在 非 高 峰 期 ， 对 每 个 更 新 /保存 操作 的 响应 时 间 应 小 于 1 秒 ; -高 峰 期 的 响应 时 间 应 
小 于 5 秒 。 
安全 

(1) 数据库 应 该 实施 密码 保护 。 

(2) 应 授予 每 名 员工 适当 的 数据 库 访问 权限 ， 这 些 权 限 分 别 作 用 于 不 同 的 用 户 视图 ， 即 
负责 人 、 经 理 、 主 管 或 者 助理 视图 。 

(3) 每 名 员工 应 该 只 能 在 表单 中 看 到 他 的 工作 必需 的 数据 ， 且 该 表单 应 与 他 正在 处 理 的 
事情 有 关 。 
备份 和 恢复 

每 天 晚上 12 点 对 数据 库 进行 备份 。 
法 律 问题 


每 个 国家 都 对 在 计算 机 内 存储 的 个 人 资料 的 使 用 做 出 了 相应 的 法 律 规定 。 由 于 DreamHome 
的 数据 库 保 存 了 员工 、 客 户 和 业主 的 个 人 信息 ， 因 此 对 任何 必须 遵守 的 法 律 条 款 都 应 该 认真 
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研读 并 绝对 遵从 。 与 数据 管理 相关 的 职业 、 法 律 和 道德 问题 将 在 第 21 章 讨论 。 


11.4.5 DreamHome 案例 研究 一 一 数据 库 设计 


本 章 示 范 了 如 何 为 Branch 和 StaffClient 视 图 生成 用 户 需 求 规格 说 明 书 ， 还 示范 了 如 
何 为 Dreamhome 数据 库 系统 定义 系统 规范 。 这 些 文档 将 成 为 生命 周期 的 下 一 阶段 一 一 数 
据 库 设计 阶段 的 信息 来 源 。 从 第 16 章 到 19 章 ， 我 们 将 逐步 讲述 数据 库 设计 的 方法 学 ， 以 
DreamHome 为 例 ， 并 使 用 本 章 已 经 生成 的 DreamHome 数据 库 系 统 的 用 户 需 求 规格 说 明 书 
和 系统 规范 ， 来 示范 数据 库 设 计 方 法 学 的 实际 应 用 。 


本 章 小 结 

© 实况 发 现 是 使 用 面谈 、 调 查 问卷 等 技术 手段 收集 关于 系统 、 需 求 和 优先 考虑 (preference) 等 实况 信 
县 的 规范 化 过 程 。 

在 生命 周期 的 前 期 阶段 (数据 库 规划 、 系 统 定义 和 需求 收集 与 分 析 阶 段 )， 实 况 发 现 显得 尤为 关键 。 
最 常用 的 五 种 实况 发 现 技术 分 别 是 : 分 析 文 档 资料 、 面 谈 、 观 察 企业 的 运作 、 研 究 和 问卷 调查 。 
在 需求 收集 与 分 析 阶 段 生 成 的 文档 主要 包括 两 种 : 用 户 需 求 规格 说 明 书 和 系统 规范 。 

用 户 需求 规格 说 明 书 详细 描述 了 数据 库 中 应 存储 的 数据 以 及 这 些 数据 的 使 用 方式 。 

系统 规范 描述 了 数据 库 系统 的 全 部 特性 ， 比 如 性 能 和 安全 需求 。 


思考 题 ) 


11.1 简要 地 描述 数据 库 开 发 人 员 进 行 实况 发 现 的 目的 。 

11.2 简 述 在 数据 库 系统 开发 生命 周期 的 各 个 阶段 如 何 应 用 实况 发 现 技术 。 

11.3 举例 说 明 在 数据 库 系统 开发 生命 周期 的 每 个 阶段 所 获取 的 实况 以 及 生成 的 文档 。 

11.4 数据 库 开 发 人 员 通 常会 在 一 个 数据 库 项 目 中 使 用 几 种 实况 发 现 技 术 ， 最 常用 的 五 种 实况 发 现 技 
术 分 别 是 : 分析 文档 资料 、 面 谈 、 观 察 企 业 的 运作 、 研 究 和 问卷 调查 。 概 述 每 一 种 实况 发 现 技 
术 并 分 析 其 优 缺 点 。 ; 

11.5 ”描述 为 数据 库 系 统 定义 任务 描述 和 任务 目标 的 目的 。 

11.6 定义 数据 库 系 统 边界 的 目的 是 什么 ? 

11.7 用 户 需求 规格 说 明 书 和 系统 规范 在 内 容 上 有 什么 不 同 ? 

118 当 开 发 具有 多 个 用 户 视图 的 数据 库 系 统 时 ， 究 竟 是 选用 集中 式 方 法 、 视 图 集成 方法 ， 还 是 混合 
使 用 这 两 种 方法 ， 请 给 出 一 种 决策 方法 。 


习题 

11.9 假设 你 是 一 家 专门 提供 数据 库 系统 分 析 、 设 计 和 实现 的 咨询 公司 的 雇员 。 最 近 有 客户 来 公司 咨 
询 数据 库 系统 实现 的 事 ， 但 他 不 熟悉 开发 过 程 。 
任务 : 要 求 你 简要 概述 为 支持 客户 的 数据 库 系统 开发 ， 你 们 公司 准备 采用 的 实况 发 现 技术 。 审 
着 这 个 任务 ， 准 备 PPT 和 报告 ， 描 述 每 一 种 实况 发 现 技 术 和 它 将 如 何 用 于 该 数据 库 系 统 的 开发 。 
本 题 中 的 客户 既 可 是 附录 B 中 任 一 假想 的 案例 研究 ， 也 可 以 是 由 你 或 你 的 老师 指定 的 任何 真正 
的 公司 。 

11.10 假设 你 是 一 家 专门 提供 数据 库 系 统 分 析 、 设 计 和 实现 的 咨询 公司 的 雇员 。 最 近 有 客户 来 公司 咨 
询 数据 库 系 统 实现 的 事 。 
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任务 : 要 求 你 完成 这 个 数据 库 项 目 早 期 阶段 的 工作 。 带 着 这 个 任务 ， 为 客户 的 数据 库 系统 定义 
任务 描述 、 任 务 目标 和 高 级 系统 图 。 

11.11 假设 你 是 一 家 专门 提供 数据 库 系统 分 析 、 设 计 和 实现 的 咨询 公司 的 雇员 。 最 近 有 客户 来 公司 咨 
询 数 据 库 系 统 实现 的 事 。 已 知客 户 要 建 的 数据 库 系统 要 支持 多 组 不 同 的 用 户 (用 户 视图 )。 
任务 : 要 求 你 说 明 如 何 能 最 好 地 管理 这 些 用户 视 图 的 需求 。 带 着 这 个 任务 ， 书 写 一 份 报告 ， 指 
出 每 个 用 户 视图 的 高 级 需求 ， 并 说 明 这 些 视 图 之 间 的 关系 。 报 告 最 后 要 根据 这 些 信息 确定 并 评 
判 在 此 管理 多 用 户 需 求 最 好 的 方法 是 什么 。 
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实体 - 联系 建 模 








| 本 章 目标 
本 章 我 们 主要 学 习 : 
© 在 数据 库 设 计 中 如 何 使 用 实体 - 联系 (ER) 建 模 技术 
© 实体 - 联系 模型 的 基本 概念 ， 即 实体 、 联 系 和 属性 
o 使 用 统一 建 模 语言 (UML) 以 图 表 化 技术 表示 一 个 ER 模型 
o 如 何 发 现 并 解决 ER 模型 中 的 连接 陷阱 问题 


第 11 章 讲述 了 收集 和 获取 数据 库 系统 用 户 需求 信息 的 主要 技术 手段 。 数 据 库 系 统 开发 
生命 周期 的 需求 收集 与 分 析 阶 段 的 工作 一 旦 结束 ， 我们 就 生成 了 数据 库 系 统 的 需求 文档 ， 也 
就 是 说 ， 我 们 已 经 为 数据 库 设 计 阶 段 做 好 了 准备 。 

数据 库 设 计 最 困难 的 一 个 方面 是 设计 人 人员、 编程 人 员 和 终端 用 户 看 待 数据 以 及 使 用 数 
据 的 方式 不 同 。 然 而 ， 除 非 我 们 能 对 企业 的 运作 模式 达成 共识 ， 否 则 数据 库 的 设计 将 无 法 
满足 用 户 的 需求 。 为 了 确保 我 们 对 数据 本 身 (本 质 ) 以 及 它们 在 企业 中 的 使 用 有 个 准确 理 
解 ， 需 要 一 种 用 于 沟通 的 模型 ， 并 且 这 种 模型 应 该 是 非 技术 性 的 和 无 二 义 性 的 。 实 体 - 联 
系 (Entity-Relationship, ER) 模型 就 是 这 样 一 种 模型 。ER 建 模 是 一 种 自 上 而 下 的 数据 库 
设计 方法 ， 该 方法 首先 确定 那些 被 称 为 实体 (entity) 的 重要 数据 和 这 些 数据 之 间 的 联系 
( relationship)， 实 体 和 联系 是 ER 模型 中 必 备 的 元 素 。 然 后 再 添加 更 多 的 细节 信息 ， 例 如 描 
述 实体 和 联系 的 属性 (attribute) 信息 ， 以 及 施加 在 实体 、 联 系 和 属性 上 的 约束 ( constraint ) 
信息 。ER 模型 是 所 有 数据 库 设计 人 员 应 该 掌握 的 一 种 重要 技术 ， 也 是 本 书 介 绍 的 数据 库 设 
计 方 法 学 的 基础 。 

本 章 主 要 介绍 ER 模型 的 基本 概念 。 尽 管 对 这 些 概念 的 含义 已 有 共同 的 认识 ,但 是 每 
种 概念 都 有 着 多 种 图 示 符 号 。 我 们 采用 的 图 形 化 符号 集 是 一 种 日 益 流 行 的 面向 对 象 建 模 语 
言 的 符号 集 ， 这 种 建 模 语言 称 为 统一 建 模 语言 (Unified Modeling Language, UML) ( Booch 
et al., 1999), UML 是 20 世纪 80 年 代 和 90 年代 间 出 现 的 若干 面向 对 象 的 分 析 和 设计 方 
法 的 后 继 产 物 。 对 象 管理 组 (Object Management Group, OMG) 创建 并 管理 着 UML (参见 
www.umlorg), UML 目前 已 成 为 软件 工程 项 目 事实 上 的 工业 标准 建 模 语 言 。 尽 管 我 们 使 用 
UML 的 符号 集 来 绘制 ER 模型 ， 但 仍 使 用 传统 数据 库 的 术语 来 定义 ER 模型 的 概念 。 在 27.8 
节 中 ， 我 们 将 进一步 讨论 UML。 本 书 在 附录 C 中 还 简要 介绍 了 另外 两 种 ER 模型 的 图 形 符 
号 集 。 

下 一 章 将 讨论 使 用 ER 模型 的 基本 概念 表示 复杂 数据 库 应 用 时 存在 的 一 些 问题 。 为 了 解 
决 这 些 问题 ， 在 原始 的 ER 模型 上 增加 了 新 的 语义 概念 ， 发 展 为 增强 的 实体 联系 ( Enhanced 
Entity-Relationship, EER) 模型 。 第 13 章 将 讲述 EER 模型 的 主要 概念 ， 包 括 特殊 化 / 泛 化 、 
聚合 以 及 组 合 。 此 外 ， 还 示范 了 如 何 将 图 12-1 的 ER 模型 转换 为 图 13-8 的 EER 模型 。 
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在 12.1 节 、12.2 节 和 12.3 节 中 介绍 ER 模型 的 基本 概念 一 一 实体 、 联 系 和 属性 ， 以 及 
在 ER 图 中 如 何 使 用 UML 图 形 化 地 表示 这 些 基本 概念 。12.4 节 讲 述 如 何 区 别 弱 实体 类 型 和 
强 实体 类 型 ， 在 12.5 节 讨论 了 不 仅 实体 拥有 属性 ， 联 系 也 可 以 拥有 属性 。12.6 节 描 述 了 联 
系 的 结构 化 约束 。 最 后 ， 在 12.7 节 中 指出 了 设计 ER 模型 时 的 一 些 潜在 问题 一 一 连接 陷阱 ， 
并 举例 说 明了 如 何 解 决 这 类 问题 。 

图 12-1 所 示 的 ER 图 是 对 DreamHome 案例 的 Branch 视图 ER 建 模 的 结果 。 该 模型 表 
示 的 数据 之 间 的 联系 是 基于 附录 A DreamHome 案例 研究 中 Branch 视图 的 需求 规格 说 明 书 。 
在 本 章 一 开始 就 给 出 这 个 图 是 为 了 使 读者 了 解 ER 建 模 可 以 建立 什么 样 的 模型 。 在 开始 阶 
段 ， 读 者 不 必 将 注意 力 集 中 于 对 这 张 图 的 完全 理解 ， 因 为 对 图 中 所 使 用 的 概念 和 符号 的 详细 
讨论 将 贯穿 全 章 。 


marStartDate 


a 


1..1 


Offers 
y 


Preference 





A 
POwns BOwns 


12-1 DreamHome Branch 视图 的 ER 


12.1 实体 类 型 
| 实体 类 型 | 被 企 事业 单位 认可 的 、 能 够 独立 存在 的 一 组 具有 相同 属性 的 对 象 。 
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ER 模型 的 基本 概念 是 实体 类 型 ， 实 体 类 型 代表 现实 世界 中 具有 相同 属性 的 一 组 对 象 。 
实体 类 型 能 够 独立 存在 ， 既 可 以 是 物理 (真实 ) 存在 的 对 象 ， 也 可 以 是 概念 〈 抽 象 ) 存在 的 
对 象 ， 具 体 实 例如 图 12-2 所 示 。 注 意 ， 关 于 实体 类 型 
我 们 只 能 给 出 一 个 能 工作 的 定义 ， 目 前 尚 不 存在 一 种 严 物理 存在 
格 的 形式 化 定义 。 这 意味 着 不 同 的 设计 人 员 可 能 会 确定 


Staff | Part 


不 同 的 实体 。 Property Supplier 
| 实体 出 现 | 实体 类 型 中 可 唯一 标识 的 一 个 对 象 。 ee eee 
一 个 实体 类 型 中 每 一 个 可 被 唯一 标识 的 对 象 都 可 简 。 ARE 
称 为 一 个 实体 出 现 (entity occurrence)。 本 书 使 用 “ 实 Viewing Sale 
体 类 型 ”或 “实体 出 现 ” 这 两 个 术语 ， 然 而 在 没有 歧义 。 Inspection Work experience 
时 ， 我 们 也 常 使 用 “实体 ”这 个 术语 。 图 12-2 ”物理 或 概念 存在 的 实体 示例 


不 同 的 实体 类 型 可 以 通过 名 字 和 一 组 属性 来 区 
分 。 一 个 数据 库 里 通常 包含 很 多 实体 类 型 。 图 12-1 
中 的 实体 类 型 包括 : Staff (员工 ), Branch (分 公司 )， 
PropertyForRent (出 租房 屋 ) 和 PrivateOwner (业主 )。 
实体 类 型 的 图 形 化 表示 

每 个 实体 类 型 都 用 一 个 标 有 名 字 的 矩形 表示 ， 名 字 
通常 是 名 词 。 在 UML 中 ， 每 个 实体 名 字 的 首 字 母 是 大 
写 的 (如 Staff 和 PropertyForRent)。 实 体 类 型 Staff 和 
Branch 的 图 形 化 表示 如 图 12-3 所 示 。 


12.2 联系 类 型 






图 12-3 Staff 和 Branch 实体 
类 型 的 图 形 化 表示 


| 联系 类 型 | 实体 类 型 间 的 一 组 有 意义 的 关联 。 


一 个 联系 类 型 是 一 个 或 多 个 实体 类 型 间 的 一 组 关联 。 每 个 联系 类 型 都 被 赋予 一 个 能 
够 描述 其 功能 的 名 字 。 图 12-1 中 有 个 名 为 POwns 的 联系 类 型 ， 它 将 PrivateOwner 和 
PropertyForRent 这 两 类 实体 关联 起 来 。 . 

与 实体 类 型 及 实体 一 样 ， 也 有 必要 区 分 “联系 类 型 ”和 “联系 出 现 ”。 


| 联系 出 现 | 由 参与 该 联系 的 各 个 实体 类 型 的 一 个 出 现 组 成 的 可 被 唯一 标识 的 关联 。 


一 个 联系 的 实例 出 现 是 指 相互 关联 的 多 个 实体 的 实例 出 现 。 本 书 使 用 术语 “联系 类 型 ” 
或 “联系 的 实例 出 现 ”， 和 术语 “实体 ”一 样 ， 无 歧义 时 ， 我们 更 多 地 是 使 用 “联系 ”这 个 
术语 。 

考虑 联系 类 型 Has， 它 表示 Branch 实体 和 Staff 实体 之 间 的 一 种 关联 ， 即 Branch Has 
Staff (分 公司 拥有 员工 )。Has 联系 的 每 一 个 实例 出 现 都 将 一 个 Branch 实体 的 实例 出 现 和 一 
个 Staff 实体 的 实例 出 现 关联 在 一 起 。 可 以 使 用 语义 网 ( semantic net) 来 表示 联系 Has 的 实 
例 出 现 的 个 体 。 语 义 网 是 一 种 对 象 层 的 模型 ， 它 使 用 符号 “@” 表 示 实 体 ， 使 用 “人 ” 表 未 
联系 。 图 12-4 所 示 的 语义 网 中 ， 有 三 个 Has 联系 的 实例 出 现 (分 别 标识 为 rl、r2 和 73 )。 
每 个 联系 都 描述 了 某 个 Branch 实体 的 实例 出 现 和 某 个 Staff 实体 的 实例 出 现 之 间 的 关联 。 联 
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系 是 使 用 连接 参与 实体 (Branch 实体 和 Staff 实体 ) 的 线 来 表示 的 。 例 如 rl 表示 Branch 的 
实体 B003 和 Staff 的 实体 SG37 之 间 的 关联 。 


Branch 实体 Has > .Staff 实体 
(branchNo) 联系 (staffNo) 





图 12-4 联系 类 型 Has 的 实例 出 现 的 语义 网 表示 


注意 ， 表 示 每 个 Branch 和 Sta 任 实体 的 实例 出 现时 ， 我 们 使 用 的 是 Branch 和 Staff fy 
关键 字 属 性 ， 即 branchNo 和 staffNo 的 值 。 主 关键 字 能 唯一 地 标识 每 个 实体 的 实例 出 现 ， 在 
后 面 的 小 节 中 将 详细 讨论 。 

如 果 使 用 语义 网 来 表示 某 个 企 事 业 单 位 ， 将 会 由 于 陷入 细节 层面 而 难以 理解 。 而 使 用 实 
体 联系 (ER) 模型 的 概念 更 容易 标识 企 事 业 单 位 中 实体 之 间 的 联系 。ER 模型 比 语义 网 具有 
更 高 层次 的 抽象 ， 这 是 因为 ER 模型 将 实体 的 实例 出 现 集合 组 合成 实体 类 型 ， 把 联系 的 实例 
出 现 组 合成 联系 类 型 。 
联系 类 型 的 图 形 化 表示 

每 个 联系 类 型 都 表现 为 用 线 将 相关 的 实体 类 型 联系 起 来 ， 并 在 线 上 标 上 联系 的 名 字 。 通 
常用 一 个 动词 (如 Supervises 或 Manages) 或 者 一 个 动词 短语 (如 LeasedBy) 来 命名 一 个 联 
系 。 同 样 ， 联 系 名 字 的 首 字 母 也 应 大 写 。 应 该 尽 可 能 保证 同一 个 ER 模型 中 的 联系 的 名 字 是 
唯一 的 。 

一 个 联系 还 应 标记 一 个 方向 ， 这 通常 
意味 着 这 个 联系 的 名 字 仅 在 一 个 方向 上 有 
意 义 ( 如 Branch Has Staff 要 比 Staff Has i 
Branch 有 意义 得 多 )。 所 以 , 一旦 确定 了 
联系 的 名 字 后 ， 为 了 让 读者 能 够 理解 联系 
的 名 字 的 意义 ， 要 在 名 字 旁边 加 上 一 个 入 
头 符号 来 表示 联系 的 正确 方向 (如 Branch 
Has » Staff)， 如 图 12-5 所 示 。 “REABA RI” 

图 12-5 联系 类 型 Branch Has Staff 的 图 形 化 表示 

12.2.1 联系 类 型 的 度 


| 联系 类 型 的 度 | 参与 联系 的 实体 类 型 的 个 数 。 


包含 在 茶 个 联系 类 型 中 的 实体 被 看 作 该 联系 的 参与 者 。 一 个 联系 类 型 的 参与 者 的 数目 称 
为 这 个 联系 的 度 。 所 以 ， 联 系 的 度 表 明了 一 个 联系 包含 的 实体 类 型 的 个 数 。 度 为 2 的 联系 称 
为 二 元 联系 。 图 12-5 中 的 联系 Has 就 是 一 个 二 元 联系 ， 该 联系 有 两 个 实体 类 型 参与 者 一 一 
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Staff Al Branch, K| 12-6 中 的 联系 POwns 也 是 一 个 二 元 联系 的 例子 ， 该 联系 的 两 个 参与 实 
体 类 型 分 别 是 PrivateOwner 和 PropertyForRent。 这 两 个 联系 也 出 现在 了 图 12-1 中 ， 除 了 
Has 和 POwns， 图 12-1 中 还 有 其 他 一 些 二 元 联系 。 事 实 上 ， 图 12-1 中 大 多 数 联系 的 度 都 
是 2。 


“私人 业主 拥有 待 出 租 的 房屋 ” 


, POwns & 
PrivateOwner PropertyForRent 


图 12-6 二 元 联系 POwns 示例 


度 为 3 的 联系 称 为 三 元 联系 。 联 系 Registers 就 是 一 个 三 元 联系 ， 有 Staff. Branch 和 
Client 三 个 实体 类 型 参与 这 个 联系 。 这 个 联系 表示 某 客 户 在 某 分 公司 的 注册 是 由 某 位 员工 完 
成 的 。 度 大 于 2 的 联系 称 为 “复杂 联系 ”。 
复杂 联系 的 图 形 化 表示 

UML 用 一 个 菱形 符号 表示 度 大 于 2 的 联系 。 联 系 的 名 字 放 在 菱形 内 部 ， 在 这 种 情况 下 ， 
与 该 名 字 相 关联 的 方向 箭头 可 以 省 略 。 三 元 联系 Registers 如 图 12-7 所 示 。 在 图 12-1 中 也 可 


以 看 到 这 个 联系 。 


图 12-7 三 元 联系 Registers 的 示例 


度 为 4 的 联系 称 为 四 元 联系 。 由 于 图 12-1 中 没有 四 元 联系 的 例子 ， 所 以 我 们 将 定义 一 个 
四 元 联系 Arranges, B45 Arranges 的 四 个 实体 类 型 是 Buyer, Solicitor, FinancialInstitution 和 
Bid， 如 图 12-8 所 示 。 这 个 联系 表示 一 位 买主 在 一 位 法 律 顾问 的 建议 下 和 一 家 金融 机 构 的 文 
持 下 投标 (Bid). 





“员工 在 某 分 公司 
登记 了 一 名 客户 ” 


“买主 在 法 律 顾问 
Solicitor 和 金融 机 构 的 支持 下 
进行 投标 ” 









Financial 
Institution 





图 12-8 ”四 元 联系 Arranges 的 示例 
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12.2.2 ŽARKA 


递归 联系 | 同一 个 实体 类 型 以 不 同 的 角色 多 次 (大 于 1 次) 参与 了 同一 个 联系 类 型 ， 这 种 联 
系 类 型 被 称 为 递归 联系 。 


考虑 递归 联系 Supervises, Supervises 表示 了 员工 和 某 位 主管 之 间 的 关联 ， 而 这 位 主管 也 
是 公司 的 一 名 员工 。 也 就 是 说 ， 实 体 类 型 Staff 两 次 参与 了 联系 Supervises : 第 一 次 参与 的 角 
色 是 一 位 主管 ， 第 二 次 参与 的 角色 是 一 名 员工 (被 管理 者 )。 递 归 联 系 有 时 也 叫做 一 元 联系 。 

可 以 添加 角色 名 称 来 表明 每 一 个 参与 联系 的 实体 类 型 在 该 联系 中 的 意义 。 在 递归 联系 
中 ， 角 色 名 称 对 于 确定 每 个 参与 者 的 作用 是 非常 重要 的 。 图 12-9 表示 了 如 何 使 用 角色 名 称 
来 描述 Supervises KR, HP Staff 实体 类 型 第 一 次 参与 时 的 角色 名 称 是 Supervisor， 第 二 
次 参与 时 的 角色 名 称 是 Supervisee。 





“i (Supervisor) 管理 员工 (Supervisee)” 


< Supervises 








Supervisor 





Supervisee 


12-9 具有 Supervisor 和 Supervisee 角色 的 递归 联系 Supervises 


当 两 个 实体 之 间 存 在 多 于 一 种 联系 时 也 可 以 使 用 角色 名 称 。 以 图 12-10 为 例 ，Staff 和 
Branch 两 个 实体 类 型 之 间 存 在 Manages 和 Has 两 种 联系 ， 此 时 添加 角色 名 就 能 够 标明 每 种 
联系 的 意义 。 具 体 来 说 ， 在 “ Staff Manages Branch” 的 联系 中 ，Sta 任 实体 中 具有 角色 名 称 
“Manager ”的 某 位 员工 管理 Branch 实体 中 具有 角色 名 称 “Branch Office” 的 某 一 分 公司 。 
类 似 地 ， 对 于 “Branch Has Staff” 联 系 ， 角 色 名 称 为 “Branch Office” 的 分 公司 雇用 角色 
PRA “Member of Staff” 的 员工 。 

“经 理 管理 分 公司 ” 





Manager Branch Office 


Manages » 
eee ee 
< Has 


Member of Staff Branch Office 





“分 公司 拥有 员工 ” 
图 12-10 通过 两 种 不 同 的 具有 角色 名 称 的 联系 一 一 Manages 和 Has 关联 起 来 的 实体 示例 
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当 参 与 联系 的 实体 在 联系 中 的 功能 无 二 义 时 ， 通 常 不 需要 定义 角色 名 称 。 
12.3 属性 


| 属性 | 实体 或 联系 类 型 所 具有 的 某 一 特性 。 


实体 类 型 具有 的 特性 称 为 属性 。 人 例如， 实体 类 型 Staff 的 属性 有 staffNo, name, position 
和 salary。 属 性 被 赋值 以 后 就 可 以 描述 每 个 实体 的 实例 出 现 ， 而 属性 值 的 集合 则 是 数据 库 中 
所 存储 数据 的 主要 构成 。 

关联 实体 的 联系 类 型 也 可 以 具有 和 实体 类 型 类 似 的 属性 ， 这 部 分 内 容 将 在 12.5 节 讨 论 。 
本 节 仅 关注 属性 的 一 般 特 征 。 


| 属性 域 | 单个 属性 或 多 个 属性 所 允许 的 取 值 集合 。 


每 个 属性 都 与 一 个 取 值 集合 相关 联 ， 这 个 集合 称 为 域 。 域 定义 了 一 个 属性 可 能 的 取 值 范 
围 ， 这 与 关系 模型 中 的 域 的 概念 (参见 4.2 节 ) 类 似 。 例 如 ， 每 一 个 房屋 实体 所 拥有 的 可 出 
租房 间 数 量 从 1 到 15 不 等 ， 所 以 ， 实 体 类 型 PropertyForRent( 可 出 租房 屋 ) 的 属性 rooms( 房 
间 数 量 ) 的 取 值 范围 是 从 1 到 15 的 任意 整数 。 

多 个 属性 可 以 共享 一 个 域 。 例 如 ， 实 体 类 型 Branch, PrivateOwner 和 BusinessOwner 都 拥有 
属性 address， 且 这 些 属性 的 域 也 相同 ， 即 可 以 取 所 有 可 能 的 地 址 。 域 还 可 以 由 其 他 一 些 域 组 
合 而 成 。 例 如 ， 实 体 Branch 的 address 属性 域 可 以 由 以 下 子 域 组 成 : street、city 和 postcode。 

属性 name 的 域 更 难 定义 ， 因 为 它 包 含 了 所 有 可 能 的 名 字 : 可 以 是 一 个 字符 串 ， 不 仅 包 
括 字 母 ， 还 可 能 包括 连 字 号 “一 ”或 其 他 一 些 特殊 的 符号 。 一 个 完整 的 数据 模型 应 该 包括 
ER 模型 中 每 一 个 属性 的 域 。 

如 下 所 述 ， 属 性 可 以 分 为 : 简单 属性 和 组 合 属性 ; 单 值 属 性 和 多 值 属性 ; 导出 属性 。 


12.3.1 简单 属性 和 组 合 属性 


| 简单 属性 | 由 独立 存在 的 单个 部 分 组 成 的 属性 。 


简单 属性 不 能 再 被 划分 为 更 小 的 部 分 ， 如 Staff 实体 的 position 和 salary 属性 就 是 简单 
属性 。 简 单 属性 有 时 又 称 为 原子 属性 。 
| 组 合 属性 | 由 多 个 部 分 组 成 的 属性 ， 每 个 部 分 都 可 独立 存在 。 

有 些 属 性 可 以 划分 为 更 小 的 部 分 ， 而 且 这 些 更 小 的 部 分 可 以 独立 存在 。 例 如 ， 看 
Branch 实体 的 address 属性 的 值 为 (163 Main St, Glasgow, G11 9QX)， 则 这 个 属性 可 以 
继续 划分 为 street, city 和 postcode 三 个 属性 ， 这 三 个 属性 的 取 值 分 别 为 (163 Main St), 
(Glasgow) 和 (G11 9QX) 。 

建 模 时 ， 究 竟 是 将 address 属性 当 作 一 个 简单 属性 ， 还 是 作为 组 合 属 性 而 由 三 个 子 属性 


street. city 和 postcode 构成 ， 依 顿 于 在 用 户 数 据 视 图 中 提 及 属性 address 时 ， 是 将 其 视 为 一 
个 整体 还 是 由 多 个 独立 部 分 组 合 而 成 。 


12.3.2 单 值 属 性 和 多 值 属性 
| 单 值 属 性 | 在 实体 类 型 的 每 个 实例 出 现 都 只 取 一 个 单 值 的 属性 。 
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大 多 数 属性 都 是 单 值 属性 。 例 如 ， 实 体 类 型 Branch 的 每 个 实例 出 现 的 分 公司 编号 
(branchNo) 属性 的 取 值 都 只 有 一 个 (如 B003 )， 因 此 属性 branchNo 被 看 作 单 值 的 。 


| 多 值 属性 | 对 于 实体 类 型 的 某 些 实例 出 现 可 能 取 多 个 值 的 属性 。 


对 于 实体 的 某 些 实例 出 现 ， 某 个 属性 可 以 有 多 个 值 。s 例如 Branch 实体 类 型 的 某 些 实例 
出 现 ， 属 性 telNo 都 可 以 有 多 个 值 ( 例 如， 编号 为 B003 的 分 公司 的 电话 号 码 为 0141-339- 
2178 和 .0141-339-4439 )， 所 以 在 这 个 示例 中 ， 属 性 telNo 就 是 多 值 的 。 多 值 属 性 的 取 值 的 
个 数 可 能 会 有 上 限 和 下 限 的 约束 。 例 如 ， 实 体 类 型 Branch 的 属性 telNo 可 以 取 1 到 3 个 值 ， 
也 就 是 说 ， 一 个 分 公司 可 能 至 少 有 一 个 电话 号 码 ， 最 多 有 3 个 电话 号 码 。 


12.3.3 “导出 属性 


导出 属性 | 属性 的 值 是 从 相关 的 一 个 或 一 组 属性 (不 一 定 来 自 同一 个 实体 类 型 ) 的 值 导 出 来 
的 属性 。 


有 些 属性 的 值 是 导出 来 的 。 例 如 ， 实 体 类 型 Lease 的 属性 duration 的 值 就 是 根据 该 实体 
类 型 的 属性 rentStart 和 rentFinish 的 值 计 算出 来 的 。 因 此 我 们 称 属性 duration 为 导出 属性 ， 
其 值 是 从 属性 rentStart 和 rentFinish 导出 的 。 

在 有 些 时 候 ， 某 些 属性 的 值 是 从 同一 实体 类 型 的 实例 出 现 导 出 来 的 。 例 如 ， 实 体 类 型 
Staff 的 总 人 数 (totalStaff) 属性 ， 就 是 通过 计算 Staff 实体 类 型 实例 出 现 的 总 的 个 数 得 到 的 。 

导出 属性 可 能 还 与 来 自 不 同 实体 类 型 的 属性 有 关 。 例 如 ， 实 体 类 型 Lease 的 属性 deposit 
的 值 就 是 从 实体 类 型 PropertyForRent 的 属性 rent 导出 的 。 


12.34 XEF 


| 候选 关键 字 | 能够 唯一 标识 每 个 实体 的 实例 出 现 的 最 小 属性 组 。 


一 个 候选 关键 字 是 一 个 最 小 属性 组 ， 它 的 值 能 够 唯一 地 标识 每 个 实体 的 实例 出 现 。 例 
如 ， 属 性 分 公司 编号 (branchNo) 是 实体 类 型 Branch 的 候选 关键 字 ， 对 于 每 个 分 公司 实体 
的 实例 出 现 ， 其 branchNo 的 值 都 是 不 同 的 。 实 体 类 型 的 每 一 个 实例 出 现 的 候选 关键 字 的 值 
都 是 唯一 的 ， 这 意味 着 候选 关键 字 不 能 为 空 (参见 4.2 节 )。 例 如 ， 每 个 分 公司 都 拥有 一 个 唯 
一 的 编号 (如 B003 )， 而 且 绝 不 会 有 两 个 或 两 个 以 上 的 分 公司 具有 相同 的 编号 (B003 )。 


| 主 关键 字 | 被 指定 用 来 唯一 标识 实体 类 型 的 每 个 实例 出 现 的 候选 关键 字 。 


一 个 实体 类 型 可 能 有 多 个 候选 关键 字 。 为 了 便于 说 明 ， 假设 每 位 员工 都 拥有 一 个 唯一 
的 公司 指派 的 员工 编号 (staffNo) 和 一 个 唯一 的 、 一 般 由 政府 使 用 的 社会 保险 号 ( National 
Insurance Number，NIN)。 那 么 实体 Sta 任 就 有 了 两 个 候选 关键 字 ， 必 须 取 其 一 作为 主 关键 字 。 

实体 主 关键 字 的 选择 要 考虑 属性 的 长 度 (长 度 最 小 者 优先 )， 以 及 该 属性 在 以 后 是 否 仍 
具有 唯一 性 。 例 如 ， 由 企业 分 配 的 员工 编号 最 多 包含 5 个 字符 (如 SG14 )， 而 NIN RSE 
含 9 个 字符 (如 WL220658D)。 所 以 我 们 选择 staffNo 作为 实体 类 型 Staff 的 主 关键 字 ， 而 
NIN 则 被 视 为 可 替换 关键 字 (alternate key), 


| 合成 关键 字 | 包括 两 个 或 两 个 以 上 属性 的 候选 关键 字 。 
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有 些 情 况 下 ， 一 个 实体 类 型 的 候选 关键 字 是 由 几 个 属性 组 成 的 ， 这 些 属性 的 值 组 合 起 来 
可 以 唯一 标识 每 个 实体 的 实例 出 现 ， 但 分 开 来 却 不 可 以 。 考 虑 实体 Advert, ‘EA propertyNo 
(房产 编号 )、newspaperName dateAdvert 和 cost 四 个 属性 。 多 家 报纸 可 能 在 同一 天 刊登 
了 多 处 房屋 出 租 的 广告 。 为 了 唯一 标识 每 个 Advert 实体 类 型 的 实例 出 现 ， 需 要 同时 确定 
propertyNo, newspaperName 和 dateAdvert 三 个 属性 的 值 。 所 以 ,实体 类 型 Advert 有 一 个 
合成 主 关键 字 ， 该 合成 关键 字 包 括 propertyNo、newspaperName 和 dateAdvert 三 个 属性 。 
属性 的 图 形 化 表示 

如 果 要 在 一 个 实体 类 型 中 显示 它 的 属性 ， 可 以 将 表示 实体 的 矩形 分 成 两 部 分 。 上 面部 分 
是 实体 的 名 字 ， 下 面部 分 列 出 属性 的 名 字 。 实 体 类 型 Staff 和 Branch 及 其 相关 属性 的 ER 图 
如 图 12-11 所 示 。 






staffNo {PK} 
name 
position 


salary 
/totalStaff 


列 出 的 第 一 个 属性 (属性 组 ) 应 该 是 实体 类 型 的 主 关键 字 (在 已 知 的 情况 下 )。 可 以 用 
符号 {PK} 来 标记 主 关键 字 属 性 (属性 组 )。 在 UML 里 ， 属 性 名 字 的 首 字 和 母 要 小 写 ， 如 果 
属性 的 名 字 中 包含 了 不 止 一 个 单词 时 ， 则 后 面 每 个 词 的 首 字 母 都 要 大 写 (例如 ，address 和 
telNo)。 当 某 个 属性 属于 某 个 合成 主 关键 字 时 ， 可 以 用 部 分 主 关键 字符 号 {PPK} 来 标记 。 可 
替换 关键 字 则 用 符号 {AK} 标记 。 图 12-11 中 ， 实 体 类 型 Staff 的 主 关 键 字 是 属性 staffNo， 
实体 类 型 Branch 的 主 关 键 字 是 属性 branchNo。 

对 于 一 些 简单 的 数据 库 系 统 来 说 ， 在 ER 图 中 把 每 个 实体 类 型 的 所 有 属性 都 列 出 来 是 可 
能 的 。 然 而 对 于 复杂 的 数据 库 系 统 来 说 ， 我 们 仅仅 列 出 了 每 一 个 实体 类 型 的 主 关键 字 属 性 
(属性 组 )。 当 ER 图 中 只 显示 主 关键 字 属 性 (属性 组 ) 时 ， 可 以 省 略 {PK} 标记 。 

对 于 简单 属性 和 单 值 属性 ， 没 有 必要 特别 标记 ， 所 以 我 们 只 要 在 实体 名 字 下 面 列 出 这 些 
属性 名 即 可 。 对 于 组 合 属性 ， 可 以 在 紧 跟 组 合 属性 名 的 下 面 一 行 开始 以 右 缩 进 的 格式 列 出 子 
属性 名 。 人 例如， 图 12-11 中 实体 Branch 的 address 属性 就 是 一 个 组 合 属性 ， 跟 在 address 的 
下 面 的 是 该 属性 的 子 属性 : street, city 和 postcode。 对 于 多 值 属性 ， 要 为 其 指明 属性 取 值 的 
个 数 范 围 。 例 如 ， 如 果 将 属性 telNo 的 范围 标记 为 [1..*]， 则 意味 着 telNo 可 有 1 个 或 大 于 1 
个 的 取 值 。 如 果 精 确 地 知道 值 的 最 大 个 数 ， 则 可 以 标记 出 属性 的 确切 范围 。 例 如 ， 如 果 属 性 
telNo 最 多 有 三 个 值 ， 则 可 以 标记 为 [1..3]。 

对 于 导出 属性 ， 在 属性 名 前 加 上 符号 “/”。 例 如 ， 在 图 12-11 中 ,实体 类 型 Staff 的 导 
出 属性 被 标记 为 /totalStaff。 
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12.4 强 实 体 类 型 与 弱 实体 类 型 
实体 类 型 可 以 分 为 强 实体 类 型 和 弱 实体 类 型 。 
| 强 实体 类 型 | 该 实体 类 型 的 存在 不 依赖 于 其 他 的 实体 类 型 。 


如 果 一 个 实体 类 型 的 存在 不 依赖 于 其 他 的 实体 类 型 ， 那 么 称 这 个 实体 类 型 为 强 实体 类 
型 。 图 12-1 中 的 强 实体 类 型 包括 : Staff. Branch, PropertyForRent 和 Client 实体 。 强 实体 
类 型 的 一 个 特征 是 可 以 使 用 该 实体 类 型 的 主 关键 字 唯 一 标识 每 个 实体 的 实例 出 现 。 例 如 ， 可 
以 使 用 实体 类 型 Staff 的 主 关键 字 staffNo 属性 唯一 标识 每 一 个 员工 。 


| 弱 实 体 类 型 | 该 实体 类 型 的 存在 依赖 于 其 他 实体 类 型 的 存在 。 


弱 实 体 类 型 的 存在 依赖 于 其 他 实体 类 型 的 存在 。 图 12-12 中 有 一 个 弱 实体 类 型 
Preference。 弱 实体 类 型 的 一 个 特征 是 ， 仅 使 用 该 实体 类 型 的 属性 无 法 唯一 标识 每 个 实体 的 
实例 出 现 。 注 意 ， 实 体 Preference 并 没有 主 关键 字 ， 这 意味 着 仅 使 用 该 实体 的 属性 无 法 标识 
每 个 实体 的 实例 出 现 。 只 有 通过 一 个 Preference 的 实例 出 现 和 某 位 客户 之 间 的 联系 ， 才 能 唯 
一 地 标识 每 个 Preference 实体 ， 而 每 个 客户 是 可 以 用 实体 类 型 Client 的 主 关键 字 clientNo ME 
一 标识 的 。 在 这 个 例子 中 ，Preference 实体 的 存在 依赖 于 Client 实体 的 存在 ，Client 实体 被 
称 为 所 有 者 实体 (owner entity). 


eh | 













Preference 





States > 


clientNo {PK} 
name 
fName 
IName 
telNo 
eMail 


图 12-12 强 实体 类 型 Client MISZ Preference 


弱 实 体 类 型 有 时 也 称 为 子 (child) SC, RH (dependent) 实体 或 从 属 (subordinate) 
实体 。 强 实体 类 型 则 称 为 父 (father) 实体 、 所 有 者 实体 或 支配 (dominant) 实体 。 


12.5 联系 的 属性 


如 12.3 PATA, 联系 也 可 以 具有 属性 。 例 如 ， 考 虑 图 12-1 中 的 联系 Advertises， 它 将 
实体 类 型 Newspaper 和 PropertyForRent 关联 起 来 。 为 了 记录 某 处 房屋 出 租 广告 的 刊登 日 期 
以 及 广告 的 费用 ， 可 以 把 这 些 信 息 同 Advertises 关联 起 来 ， 作 为 联系 Advertises 的 属性 一 一 
dateAdvert 和 cost， 而 不 是 把 它们 看 作 实 体 Newspaper 或 者 PropertyForRent 的 属性 。 
联系 的 属性 的 图 形 化 表示 

在 表示 与 某 个 联系 相关 联 的 属性 时 ， 采 用 与 实体 类 型 相同 的 符号 。 但 是 ， 为 了 区 分 带 有 
属性 的 联系 与 实体 ， 将 表示 属性 的 矩形 和 联系 用 虚线 连接 起 来 。 拥 有 属性 dateAdvert 和 cost 
的 联系 Advertises 如 图 12-13 所 示 。 男 外 一 个 示例 就 是 图 12-1 中 的 拥有 属性 mgrStartDate 
和 bonus 的 Manages 联系 。 












prefType 
maxRent 
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“在 报纸 上 宣传 待 出 租房 产 ” 
l 


dateAdvert 
cost 





图 12-13 具有 dateAdvert 和 cost 属性 的 Advertises 联系 


对 于 拥有 一 个 或 多 个 属性 的 联系 ， 意 味 着 该 联系 隐蔽 着 一 个 未 标识 的 实体 类 型 。 例 如 ， 
联系 Advertises 拥有 dateAdvert 和 cost 两 个 属性 ， 这 可 能 意味 着 实体 Advert 的 存在 。 


12.6 ”结构 化 约束 


下 面 分 析 参 与 联系 的 实体 类 型 上 可 能 存在 的 约束 。 这 些 约束 应 该 反映 出 在 现实 世界 中 对 
这 些 联系 的 限制 。 这 种 约束 的 例子 包括 : 要 求 可 供出 租 的 房产 必须 有 一 个 业主 ， 每 个 分 公司 
必须 有 员工 等 。 联 系 上 主要 的 约束 称 为 多 重 性 (multiplicity ) 。 


多 重 性 | 指 一 个 参与 实体 类 型 通过 某 一 联系 与 另 一 参与 实体 类 型 的 某 个 出 现 发 生 关 联 的 出 
现 的 数目 (或 者 范围 )。 


多 重 性 约束 了 实体 间 关 联 的 方式 ， 它 是 用 户 或 企业 建立 的 策略 (或 商业 规则 ) 的 一 种 表 
示 。 识 别 并 能 够 表示 出 所 有 适当 的 企业 约束 对 于 建 模 来 说 是 非常 重要 的 。 

如 前 所 述 ， 最 常见 的 联系 的 度 是 二 元 的 。 二 元 联系 通常 又 可 分 为 一 对 一 (1:1 )、 一 对 多 
( 1:*) 或 多 对 多 (*:*) 的 。 我 们 使 用 下 面 的 完整 约束 来 说 明 这 三 种 联系 : 

e 一 个 分 公司 由 一 名 员工 管理 (1:1 )。 

e 一 名 员工 负责 管理 多 处 可 供出 租 的 房产 ( 1:*)。 

e 可 以 在 多 家 报纸 上 刊登 多 处 房屋 出 租 的 广告 (*:*)。 

在 12.6.1、12.6.2 和 12.6.3 节 中 ,我 们 将 举例 说 明 如 何 确定 这 些 约束 的 多 重 性 ， 并 分 别 
用 ER 图 表示 。 在 12.6.4 节 ， 我们 将 分 析 那 些 度 大 于 2 的 联系 的 多 重 性 。 

注意 : 并 不 是 所 有 的 完整 性 约束 都 可 以 简单 地 用 ER 模型 表示 。 例 如 ， 每 一 名 员工 每 年 
都 会 由 于 在 企 事业 单位 工作 而 得 到 一 天 额外 的 休假 ， 这 样 的 约束 是 很 难 用 ER 模型 表示 的 。 


12.6.1 一 对 一 (1:1) 联系 

考虑 联系 Manages， 它 将 实体 类 型 Staff 和 Branch 关联 起 来 。 图 12-14a 用 语义 网 给 出 
了 Manages 联系 类 型 的 两 个 实例 出 现 (分 别 标识 为 rl 和 7r2 )。 每 个 联系 (rm) 都 表示 了 一 个 
Staff 实体 的 实例 出 现 和 一 个 Branch 实体 的 实例 出 现 之 间 的 关联 。 我 们 用 实体 类 型 Staff 和 
Branch 主 关键 字 staffNo 和 branchNo 来 标识 每 个 Staff 和 Branch 实体 的 实例 出 现 。 
多 重 性 的 确定 

多 重 性 的 确定 通常 需要 精确 分 析 企 业 约 束 里 给 出 的 样本 数据 之 间 的 联系 。 我 们 可 以 通过 
分 析 已 经 填 好 的 表单 或 者 报表 来 获取 样本 数据 ， 如 果 可 能 的 话 ， 也 可 以 通过 和 用 户 进行 讨论 
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来 获取 。 但 是 ， 需 要 强调 的 是 ， 只 有 当 所 分 析 和 讨论 的 样本 数据 能 够 真实 全 面 地 反映 了 建 模 
所 涉及 的 数据 时 ， 我 们 才能 得 到 关于 约束 的 正确 结论 。 

在 图 12-14a 中 可 以 看 到 staffNo 为 SG5 的 员工 管理 着 branchNo 为 B003 的 分 公司 ， 
staffNo 为 SL21 的 员工 则 管理 着 branchNo 为 B005 的 分 公司 ， 而 staffNo 为 SG37 的 员工 不 
管理 任何 分 公司 。 也 就 是 说 ,一 名 员工 可 以 管理 零 或 一 个 分 公司 ， 一 个 分 公司 由 一 名 员工 管 
理 。 在 该 联系 中 ， 对 于 每 位 员工 来 说 ， 与 其 相关 联 的 分 公司 的 最 大 个 数 为 1 ; 而 对 于 每 个 分 
公司 来 说 ， 与 其 相关 联 的 员工 的 最 大 个 数 也 为 1。 我们 将 这 种 类 型 的 联系 看 作 是 一 对 一 的 ， 
通常 简写 为 (1:1 )。 

一 对 一 联系 的 图 形 化 表示 

图 12-14b 是 联系 Staff Manages Branch 的 ER 图 。 为 了 表示 一 个 员工 可 以 管理 零 或 一 个 
分 公司 ， 我 们 在 实体 Branch 的 旁边 标注 了 “0..1”。 为 了 表示 一 个 分 公司 总 有 一 名 经 理 ， 在 
实体 Staff 旁边 标注 了 “1..1”。( 注 意 ， 对 于 一 对 一 联系 ， 可 以 选择 另外 一 个 合适 的 联系 名 ， 
使 其 在 相反 的 方向 上 有 意义 。) 


Staff 实体 类 型 Manages Branch 实体 类 型 
(staffNo) 联系 类 型 (branchNo) 











Branch 


Manages » 






b ) 一 对 一 联系 Staff Manages Branch 的 多 重 性 
图 12-14 


12.6.2 “一 对 多 (1:*) 联系 

考虑 联系 Oversees， 它 将 实体 类 型 Staff 和 PropertyForRent 关联 起 来 。 图 12-15a 是 联 
系 类 型 Staff Oversees PropertyForRent 的 三 个 实例 出 现 (分 别 标识 为 rl1、r2 和 fr3 ) 的 语义 
网 表示 。 每 一 个 联系 (rn) 都 表示 了 一 个 Staff 实体 的 实例 出 现 和 一 个 PropertyForRent 实 
体 的 实例 出 现 之 间 的 关联 。 我 们 用 实体 类 型 Staff 和 PropertyForRent 的 主 关键 字 staffNo 和 
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propertyNo 来 标识 每 个 Staff 和 PropertyForRent 实体 的 实例 出 现 。 


多 重 性 的 确定 

在 图 12-15a 中 可 以 看 到 staffNo 为 SG37 的 员工 监管 propertyNo 分 别 为 PG21 和 PG36 
的 两 处 房产 ，staffNo 为 SA9 的 员工 监管 propertyNo 为 PA14 的 房产 ， 而 staffNo 为 SG5 的 
员工 不 监管 任何 房产 ， 并 且 没 有 任何 员工 监管 propertyNo 为 PG4 的 房产 。 总 而 言 之 ， 一 个 
员工 可 以 监管 零 或 多 处 可 出 租房 屋 ， 一 处 可 出 租房 屋 被 零 或 一 个 员工 监管 。 因 此 ， 对 于 参与 
联系 的 每 位 员工 来 说 ， 与 其 相关 联 的 房产 有 很 多 处 ;对 于 每 处 房产 来 说 ， 与 其 相关 联 的 员工 
的 最 大 个 数 为 1。 我 们 将 这 种 类 型 的 联系 看 作 是 一 对 多 的 ， 通 常人 简写 为 ( 1:*)。 
一 对 多 联系 的 图 形 化 表示 

图 12-15b 是 联系 Staff Oversees PropertyForRent 的 ER 图 。 为 了 表示 一 名 员工 可 以 管理 
零 或 多 处 可 出 租房 产 ， 我 们 在 实体 PropertyForRent 旁边 标注 了 “0..*”; 为 了 表示 一 处 可 出 
租房 产 可 由 零 或 一 名 员工 管理 ， 在 实体 Staff 旁边 标注 了 “0..1”。( 注 意 ， 对 于 1:*， 联 系 的 
名 字 只 有 在 一 对 多 方向 上 才 有 意义 。) 

如 果 我 们 能 够 知道 多 重 性 的 最 大 值 和 最 小 值 ， 就 可 以 使 用 这 些 数值 。 例 如 ， 如 果 一 名 员 
工 可 以 管理 最 少 零 处 或 最 多 100 处 可 出 租房 产 ， 就 可 以 用 “0..100” 代 替 “0..*”。 


Staff 实体 Oversees PropertyForRent 实体 
(staffNo) 联系 (propertyNo) 





Staff Oversees > PropertyForRent 


b ) 一 对 多 联系 类 型 Staff Oversees PropertyForRent 的 多 重 性 
图 12-15 
12.6.3 ”多 对 多 (*:*) 联系 


考虑 联系 Advertises， 它 将 实体 类 型 Newspaper 和 PropertyForRent 关联 起 来 。 图 12-16a 
是 联系 Advertises 的 四 个 实例 出 现 (分 别 标识 为 r1、r2、r3 和 r4 ) 的 语义 网 表示 。 每 个 联 
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系 (rn) 都 表示 一 个 Newspaper 实体 的 实例 出 现 和 一 个 PropertyForRent 实体 的 实例 出 现 之 
间 的 关联 。 我 们 用 实体 类 型 Newspaper 和 PropertyForRent 的 主 关键 字 newspaperName 和 
propertyNo 来 标识 每 个 Newspaper 和 PropertyForRent 实体 的 实例 出 现 。 
多 重 性 的 确定 

在 图 12-16a 中 我 们 可 以 看 到 《格拉 斯 哥 日 报 》 刊 登 了 propertyNo 分 别 为 PG21 和 PG36 
的 两 处 房屋 的 出 租 广告 ,《 西 部 新 闻 》 刊 登 了 propertyNo 为 PG36 的 房屋 出 租 广告 ， 而 《 阿 
伯 丁 快报 》 刊 登 了 propertyNo 为 PA14 的 房屋 出 租 广告 。 然 而 propertyNo 为 PG4 的 房产 并 
没有 在 任何 报纸 上 刊登 出 租 广 告 。 也 就 是 说 ， 一 种 报纸 上 可 以 刊登 一 或 多 处 房屋 的 出 租 广 
告 ， 一 处 房产 可 以 在 零 或 多 种 报纸 上 刊登 出 租 广 告 。 所 以 ， 对 报纸 来 说 ， 有 多 处 可 供出 租 的 
房产 ; 对 于 参与 联系 的 每 一 处 可 供出 租 的 房产 来 说 ， 也 有 着 多 种 报纸 。 我 们 将 这 种 类 型 的 联 
系 看 作 是 多 对 多 的 ， 通 常 简写 为 (*:*)。 
多 对 多 联系 的 图 形 化 表示 

图 12-16b 是 联系 Newspaper Advertises PropertyForRent 的 ER 图 。 为 了 表示 每 种 报纸 
可 以 刊登 一 处 或 多 处 房屋 出 租 广 告 ， 我 们 在 实体 PropertyForRent 旁边 标注 了 “1..*”; 为 
了 表示 每 个 可 出 租房 屋 能 在 零 或 多 种 报纸 上 刊登 广告 ， 我 们 在 实体 Newspaper 旁边 标注 了 
“0..* ”。( 注 意 ， 对 于 一 个 多 对 多 联系 ,我们 可 以 选择 一 个 合适 的 联系 名 字 ， 使 得 在 每 个 方 
向 上 的 联系 都 是 有 意义 的 。) 


Newspaper 实体 Advertises PropertyForRent 实体 
(newspaperName) 联系 (propertyNo) 



















Tween 


b) 多 对 多 联系 Newspaper Advertises PropertyForRent 的 多 重 性 
12-16 


Advertises » 


R12 # FK-RARH 287 


1264 ”复杂 联系 的 多 重 性 
对 于 那些 高 于 二 元 联系 的 复杂 联系 ， 它 们 的 多 重 性 将 稍微 复杂 一 些 。 


多 重 性 (复杂 联系 )| 在 一 个 天 元 联系 中 ， 当 其 他 ( n-1 ) 个 实体 类 型 的 值 固定 以 后 ， 另 外 一 
个 实体 类 型 可 能 参与 联系 的 实例 出 现 的 个 数 (或 范围 )。 


一 般 而 言 ，n 元 联系 的 多 重 性 表示 当 联 系 中 其 他 (n-1) 个 参与 实体 类 型 的 值 固定 以 后 ， 
另外 这 个 实体 类 型 可 能 参与 联系 的 实例 出 现 的 潜在 个 数 。 例 如 ， 一 个 三 元 联系 的 多 重 性 表示 
当 联 系 中 的 某 两 个 参与 实体 类 型 的 值 确 定 后 ， 剩 下 的 那个 参与 实体 的 实例 出 现 可 能 的 个 数 (或 
范围 )。 考 虑 图 12-17 中 的 Staff, Branch 和 Client 之 间 的 三 元 联系 Registers。 图 12-17a 为 
Registers 联系 的 五 个 实例 出 现 〈 分 别 标识 为 rl ~ r5 ) 的 语义 网 表示 。 每 一 个 联系 (rm) 表示 
一 个 Staff 实体 的 实例 出 现 、 一 个 Branch 实体 的 实例 出 现 以 及 一 个 Client 实体 的 实例 出 现 之 
间 的 关联 。 我 们 用 实体 Staff. Branch 和 Client 的 主 关 键 字 staffNo、branchNo 和 clientNo 来 
标识 每 个 Staff, Branch 和 Client 实体 的 实例 出 现 。 在 图 12-17a 中 ， 分 析 了 当 联 系 Registers 
中 的 实体 Staff 和 Branch 的 值 确定 以 后 的 情况 。 

多 重 性 的 确定 

在 图 12-17a 中 ， 当 staffNo/branchNo 的 值 固定 以 后 ，clientNo FH] RAMA ASA, fi 
如 ， 在 B003 (branchNo) 分 公司 工作 的 员工 SG37 ( staffNo) 为 客户 CR56 (clientNo) 和 
CR74 ( clientNo) 进行 了 登记 注册 ; 分 公司 B003 (branchNo) 的 员工 SG14 ( staffNo) 为 客 
户 CR62 (clientNo)、CR84 (clientNo) 和 CR91 (clientNo) 进行 了 登记 注册 ; 分 公司 B003 
的 员工 SG5 没有 为 任何 客户 进行 过 注册 。 也 就 是 说 ， 当 staffNo 和 branchNo 的 值 固定 以 后 ， 
与 其 对 应 的 clientNo 值 可 以 是 零 个 或 多 个 。 因 此 ， 从 Staff 和 Branch 实体 的 角度 来 看 ， 联 系 
Registers 的 多 重 性 是 “0..*”， 在 ER 图 中 ， 我 们 将 “0..* ”标注 在 Client 实体 旁 。 

如 果 重 复 进行 这 样 的 测试 ， 则 当 Staff/Client 值 固 定 后 ， 联 系 Registers 的 多 重 性 是 
“1..1”， 于 是 在 Branch 实体 旁 标注 “1..1”; 当 Client/Branch 的 值 固 定 后 ， 联 系 Registers 的 
多 重 性 是 “1..1”"， 则 在 Staff 实体 旁 标注 “1..1”。 图 12-17b 为 三 元 联系 Registers 的 多 重 性 
的 ER 图 。 


Staff/Branch 实体 Registers Client 实体 
(staffNo/branchNo) 联系 (clientNo) 





a) 三 元 联系 Registers 的 五 个 实例 出 现 的 语义 网 表示 ， 
其 中 Staff 和 Branch 实 体 类 型 的 值 是 固定 的 


图 12-17 


288 FAD KHEEDMS Kitt 






b) 三 元 联系 Registers 的 多 重 性 
图 12-17 (2%) 
K 12-1 简要 地 列 出 了 可 能 的 多 重 性 约束 的 表示 方法 和 每 种 表示 方法 的 含义 。 
表 12-1 多 重 性 约束 表示 方法 概述 


可 能 的 多 重 性 约束 的 表示 方法 含义 
0..1 0 个 或 1 个 实体 出 现 
1..1 (或 1) 只 有 1 个 实体 出 现 
0..* (ak *) 0 个 或 多 个 实体 出 现 
1.7 1 个 或 多 个 实体 出 现 
5..10 实体 出 现 的 个 数 从 最 少 5 个 到 最 多 10 个 
0, 3, 6-8 实体 出 现 可 以 为 0 个 3 个 ，6 个 、7 个 或 8 不 


12.6.5 ”基数 约束 和 参与 性 约束 

事实 上 ， 多 重 性 由 两 个 独立 的 约束 组 成 ， 即 基数 ( cardinality) 约束 和 参与 性 (participation) 
约束 。 
| 基数 | 在 指定 的 联系 类 型 中 ， 一 个 实体 可 能 参与 的 联系 出 现 的 最 大 数目 。 


一 个 三 元 联系 的 基数 就 是 在 前 面 所 说 的 一 对 一 C 1:1), 一 对 多 (1:*) 和 多 对 多 (*:*)。 
联系 的 基数 实际 上 就 是 联系 的 每 一 个 参与 实体 的 多 重 性 范围 中 的 最 大 值 。 例 如 ， 在 图 12-18 
中 ， 联 系 Manages 的 基数 是 一 对 一 ( 1:1 )， 而 这 个 基数 就 是 该 联系 两 端的 参与 实体 的 多 重 性 
范围 中 的 最 大 值 。 


| 参与 性 | 说 明 所 有 实体 出 现 是 否 都 参与 了 联系 。 


参与 性 约束 表示 在 一 个 联系 中 ， 是 所 有 实体 出 现 都 参与 了 该 联系 〈 称 为 强制 参与 )， 还 
是 只 有 一 部 分 实体 出 现 参 与 ( 称 为 可 选 参 与 )。 实 体 的 参与 性 实际 上 就 是 联系 的 每 一 个 参与 
实体 的 多 重 性 范围 中 的 最 小 值 。 当 多 重 性 的 最 小 值 为 零 时 就 是 可 选 参与 ， 多 重 性 的 最 小 值 为 
1 时 则 为 强制 参与 。 要 注意 的 是 ， 某 个 实体 的 参与 性 是 由 在 联系 中 另外 一 方 实体 的 多 重 性 的 
最 小 值 决定 的 。 例 如 ， 在 图 12-18 中 ， 联 系 Manages 中 的 实体 Staff 是 可 选 参 与 的 ， 这 是 由 
实体 Branch 旁边 的 多 重 性 的 最 小 值 0 决定 的 ; 而 联系 Manages 中 的 实体 Branch 的 强制 参与 
则 是 由 实体 Staff 旁边 的 多 重 性 的 最 小 值 1 决定 的 。 
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图 12-18 一 对 一 联系 Staff Manages Branch 的 多 重 性 ， 包 括 基数 约束 和 参与 约束 


12.7 ER 模型 的 问题 


本 节 研 究 在 创建 ER 模型 时 可 能 产生 的 问题 。 这 些 问 题 被 称 为 连接 陷阱 (connection 
trap )， 通 常 是 由 于 错误 地 理解 了 联系 的 意义 而 引起 的 (Howe，1989 )。 我 们 研究 两 类 主要 的 
连接 陷阱 ， 即 扇形 陷阱 ( fan trap) 和 断层 陷阱 (chasm trap)， 并 讨论 在 ER 模型 中 如 何 发 现 
和 解决 这 些 问题 。 

通常 ， 为 了 识别 连接 陷阱 ， 我 们 必须 确保 能 够 完全 理解 联系 所 表达 的 意义 并 且 能 够 清晰 
地 定义 联系 。 如 果 我 们 不 能 充分 理解 联系 的 意义 ， 那 么 我 们 也 就 无 法 创建 一 个 能 够 表达 真实 
世界 的 模型 。 


12.7.1 扇形 陷阱 


扇形 陷阱 | 模型 给 出 了 两 实体 类 型 之 间 的 一 种 联系 ， 但 在 某 些 实体 出 现 之 间 存 在 着 多 条 通 
路 (pathway). 


当 一 个 实体 扇 出 了 两 个 或 更 多 的 KR, BAR TEA IB ABE. E 12-19a 显示 了 一 
个 潜在 的 扇形 陷阱 ， 因 为 从 实体 Division 出 发 的 1:* 联系 共有 两 个 : Has 和 Operates. 

这 个 模型 反映 了 这 样 一 个 事实 ， 即 一 个 部 门 ( division) 管理 着 一 个 或 多 个 分 公司 并 拥 
有 一 名 或 多 名 员工 。 然 而 ， 当 我 们 想 知 道 某 个 员工 到 抵 在 哪个 分 公司 工作 时 ， 问 题 就 出 现 
了 。 为 了 更 好 地 解释 这 个 问题 ， 我 们 来 分 析 联 系 Has 和 Operates 的 一 些 出 现 ， 我 们 用 实体 
类 型 Staff. Division 和 Branch 的 主 关键 字 属 性 的 值 分 别 标识 这 些 实体 出 现 ， 如 图 12-19b 
所 示 。 

当 我 们 试图 回答 “编号 为 SG37 的 员工 在 哪个 分 公司 工作 ?” 这 个 问题 时 ， 却 无 法 基于 
当前 的 结构 给 出 一 个 确切 的 答案 。 我 们 只 能 确定 员工 SG37 可 能 在 分 公司 B003 或 B007 T. 
作 。 之 所 以 无 法 确切 地 回答 这 个 问题 是 由 于 刷 形 陷阱 的 原因 ， 而 扇形 陷阱 的 产生 则 是 由 于 
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错误 地 表示 了 实体 Staff, Division 和 Branch 之 间 存 在 的 联系 。 为 了 消除 这 个 扇形 陷阱 ， 我 
们 对 最 初 的 ER 模型 进行 了 重建 ， 给 出 了 这 些 实体 间 联 系 的 正确 表示 ， 如 图 12-20a 所 示 。 





a) 扇形 陷阱 示例 


Staff Has Division Operates Branch 





b ) 图 12-19a 的 ER 模型 的 语义 网 表示 
图 12-19 


现在 ， 再 来 分 析 一 下 图 12-20b 中 的 联系 Operates 和 Has 的 出 现 ， 我 们 就 能 够 坚定 地 回 
答 前 面 提 出 的 问题 了 。 根 据 这 个 语义 网 模型 ， 我 们 就 可 以 断定 员工 SG37 在 分 公司 B003 工 
作 ， 而 分 公司 B003 又 隶属 于 部 门 D1。 





a) 重建 图 12-19a 中 的 ER 模型 以 消除 扇形 陷阱 


Division Operates Branch Has Staff 
实体 联系 实体 联系 实体 








b) 图 12-20a 的 ER 模型 的 语义 网 表示 
12-20 
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12.7.2 断层 陷阱 


| 断层 陷阱 | 模型 表明 某 些 实体 类 型 之 间 存 在 着 联系 ， 但 某 些 实体 出 现 之 间 却 不 存在 通路 。 


相关 实体 的 路 径 上 存在 着 一 个 或 多 个 多 重 性 的 最 小 值 为 零 ( 即 可 选 参与 ) 的 联系 时 ， 就 
会 出 现 断 层 陷阱 。 图 12-21a 显示 了 实体 Branch, Staff 和 PropertyForRent 之 间 的 联系 ， 
中 存在 一 个 潜在 的 断层 陷阱 。 

该 模型 反映 了 这 样 一 个 事实 ， 一 个 分 公司 可 以 拥有 一 名 或 多 名 员工 ， 每 名 员工 监管 零 或 
多 处 出 租房 屋 。 我 们 还 要 注意 ， 并 非 所 有 的 员工 都 监管 着 出 租房 屋 ， 而 且 也 不 是 所 有 的 出 租 
房屋 都 已 被 员工 监管 。 因 此 ， 当 我 们 想 知道 在 每 个 分 公司 都 有 哪些 房屋 可 以 出 租 时 ， 问 题 就 
出 现 了 。 为 了 解决 这 个 问题 ， 让 我 们 分 析 一 下 图 12-21b 中 的 联系 Has 和 Oversees 的 某 些 出 
现 ， 我 们 用 实体 类 型 Branch Staff 和 PropertyForRent 的 主 关键 字 属 性 的 值 来 标识 这 些 实体 
的 出 现 。 





Branch Has Staff Oversees PropertyForRent 
实体 联系 实体 





b) 图 12-21a 中 的 ER 模型 的 语义 网 表示 
图 12-21 


如 果 提 出 “编号 为 PA14 的 房屋 是 由 哪个 分 公司 负责 监管 及 出 租 的 ?” 这 样 的 问题 ， 我 
们 将 无 法 回答 。 因 为 该 出 租房 屋 还 没有 分 配给 在 某 个 分 公司 工作 的 员工 负责 。 无 法 回答 这 
个 问题 的 原因 ， 被 归 答 于 信息 的 缺失 (众所周知 ， 房 屋 必须 先 在 某 个 分 公司 中 注册 ， 然 后 
上 下 指 派 给 员工 监管 )， 并 由 此 导致 了 断层 陷阱 的 产生 。 参 与 Oversees 联系 的 实体 Staff 和 
PropertyForRent 的 多 重 性 的 最 小 值 都 为 零 ， 这 就 意味 着 某 些 房产 将 无 法 通过 员工 和 分 公 
司 关 联 起 来 。 因 此 要 解决 这 个 问题 ， 我 们 需要 找到 遗漏 的 联系 ， 在 这 个 示例 中 就 是 实体 
Branch 和 PropertyForRent 之 间 Offers 联系 。 图 12-22a 中 的 ER 模型 给 出 了 这 些 实体 之 间 关 
联 的 正确 表示 。 该 模型 能 够 确保 在 任何 时 候 ， 与 每 个 分 公司 相关 联 的 可 出 租房 屋 都 能 够 找 
到 ， 其 中 包括 那些 还 未 分 配给 员工 监管 的 房屋 。 

如 果 我 们 现在 再 来 分 析 一 下 图 12-22b 中 的 联系 类 型 Has, Oversees 和 Offers 的 出 现 ， 
就 能 够 断定 编号 为 PA14 的 房屋 是 由 分 公司 B007 管理 。 
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a) 重建 图 12-21a 中 的 ER 模型 以 消除 断层 陷阱 
Branch Has Staff Oversees PropertyForRent 
联系 实体 





b ) 图 12-22a 中 的 ER 模型 的 语义 网 表示 
图 12-22 


本 章 小 结 


实体 类 型 是 经 由 企 事业 单位 认可 、 能 够 独立 存在 的 一 组 具有 相同 属性 的 对 象 。 实 体 出 现 是 实体 类 型 
中 可 以 被 唯一 标识 的 一 个 对 象 。 

联系 类 型 是 实体 类 型 间 的 一 组 有 意义 的 关联 。 联 系 出 现 是 可 被 唯一 标识 的 一 个 关联 ， 该 关联 包括 了 
每 个 参与 实体 类 型 的 一 个 实体 出 现 。 

联系 类 型 的 度 是 指 参与 该 联系 的 实体 类 型 的 个 数 。 

递归 联系 中 存在 这 样 的 参与 者 ， 即 同一 个 实体 类 型 不 止 一 次 地 以 不 同 的 角色 参与 了 该 联系 。 

属性 是 实体 类 型 或 联系 类 型 所 具有 的 某 一 特性 。 

属性 域 是 单个 属性 或 多 个 属性 所 允许 的 取 值 集合 。 


RIŽ FHA-RARH 293 


简单 属性 由 不 可 划分 的 、 独 立 存 在 的 单一 成 分 组 成 。 

组 合 属性 由 多 个 部 分 组 成 ， 每 个 部 分 都 能 够 独立 存在 。 

单 值 属性 是 指 对 实体 类 型 的 每 个 实体 出 现 来 说 ， 该 属性 只 有 单独 一 个 值 。 

多 值 属 性 是 指 对 实体 类 型 的 每 个 实体 出 现 来 说 ， 该 属性 可 能 有 多 个 值 。 

导出 属性 表示 一 个 属性 的 值 可 以 由 相关 的 一 个 属性 或 一 组 属性 的 值 导出 ， 这 一 组 属性 可 以 来 自 多 个 
实体 类 型 。 

候选 关键 字 是 能 够 唯一 标识 每 个 实体 出 现 的 最 小 属性 组 。 

主 关键 字 是 被 选用 唯一 标识 每 个 实体 出 现 的 茶 一 候选 关键 字 。 

合成 关键 字 是 包含 两 个 或 两 个 以 上 属性 的 候选 关键 字 。 

强 实体 类 型 不 依赖 于 其 他 的 实体 类 型 而 独立 存在 。 弱 实体 类 型 则 需要 依赖 于 其 他 实体 类 型 的 存在 而 存在 。 
多 重 性 是 指 一 个 参与 实体 类 型 通过 某 一 联系 与 男 一 个 参与 实体 类 型 的 某 个 出 现 发 生 关联 的 出 现 的 数 
目 (或 者 范围 )。 

复杂 联系 的 多 重 性 是 在 一 个 n 元 联系 中 ， 当 其 他 (n-1 ) 个 实体 类 型 的 值 固 定 以 后 ， 男 外 一 个 实体 
类 型 可 能 参与 联系 的 出 现 的 数目 (或 范围 )。 


e 基数 描述 了 在 指定 的 联系 类 型 中 ， 对 于 一 个 实体 来 说 其 可 能 参与 的 联系 的 出 现 的 最 大 个 数 。 
e 参与 性 说 明 是 否 实体 的 所 有 出 现 都 参与 了 联系 。 
© 大 模型 给 出 了 两 实体 类 型 之 间 的 一 种 联系 ,但 在 这 些 实体 的 某 些 出 现 之 间 却 存在 着 多 条 通路 ， 则 称 


存在 扇形 陷阱 。 
若 模型 表明 某 些 实体 类 型 之 间 存 在 着 联系 ， 但 这 些 实 体 的 某 些 出 现 之 间 却 不 存在 通路 ， 则 称 存 在 断 
层 陷 阱 。 


12.1 描述 在 ER 模型 中 实体 类 型 表示 什么 ， 并 给 出 物理 存在 或 概念 存在 的 实体 的 实例 。 
12.2 ”描述 在 ER 模型 中 联系 类 型 表示 什么 ， 并 给 出 一 元 联系 、 二 元 联系 、 三 元 联系 和 四 元 联系 的 实例 。 
12.3 ”描述 在 ER 模型 中 属性 表示 什么 ， 并 给 出 简单 属性 、 组 合 属性 、 单 值 属性 、 多 值 属性 和 有 寻 出 属 


性 的 实例 。 


12.4 联系 类 型 的 多 重 性 约束 表示 什么 ? 

12.5 ”什么 是 完整 性 约束 ? 如 何 使 用 多 重 性 设计 实现 这 些 约束 ? 

12.6 在 联系 类 型 中 多 重 性 如 何 表 示 基 数 约束 和 参与 性 约束 ? 

12.7 给 出 一 个 具有 属性 的 联系 类 型 的 例子 。 

12.8 ”描述 弱 实 体 类 型 和 强 实体 类 型 的 区 别 ， 并 举例 说 明 。 

12.9 ”描述 在 ER 模型 中 ， 扇 形 陷阱 和 断层 陷阱 是 如 何 发 生 的 以 及 应 如 何 解 决 。 


习题 
12.10 为 下 面 的 每 一 个 需求 描述 建立 一 个 ER 图 : 


(a) 一 个 公司 有 四 个 部 门 ， 每 个 部 门 属 于 一 个 公司 。 

(b) (a) 中 的 每 个 部 门 雇用 一 名 或 多 名 雇员 ， 每 名 雇员 在 一 个 部 门 工作 。 
(c) (b) 中 的 每 名 雇员 可 能 有 一 名 或 多 名 家 属 ， 每 个 家 属 属于 一 名 雇员 。 
(d) (c) 中 的 每 名 雇员 可 能 拥有 工作 经 历 。 

(e) 合并 (a), (b), (c) 和 (d) 的 ER 图 为 一 个 ER 图 。 
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12.11 


12.12 


12.13 


12.14 
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一 家 从 事 IT 培训 的 公司 请 你 根据 其 数据 需求 建立 一 个 概念 数据 模型 。 公 司 有 30 名 讲师 ， 每 期 

培训 可 以 接收 100 名 学 员 。 公 司 共有 五 门 高 级 技术 培训 课程 ， 每 门 课程 由 一 个 培训 组 进行 培 

训 ， 每 个 培训 组 拥有 两 名 或 两 名 以 上 的 讲师 。 每 名 讲师 最 多 只 能 被 分 派 到 两 个 培训 组 中 或 者 仅 

从 事 研 究 工 作 。 每 名 受训 者 在 每 期 培训 中 只 能 学 习 一 门 高 级 技术 课程 。 

(a) 确定 公司 的 主要 实体 类 型 。 

(b) 确定 主要 的 联系 类 型 和 每 个 联系 的 多 重 性 ， 并 声明 你 对 数据 所 做 的 所 有 假设 。 

(c) 使 用 (a) 和 (b) 中 的 结果 ， 画 出 表示 该 公司 数据 需求 的 ER Al. 

阅读 下 面 的 案例 分 析 ， 它 描述 了 一 家 影碟 出 租 公 司 的 数据 需求 。 这 家 影碟 出 租 公 司 在 全 美 有 几 

家 分 公司 。 每 个 分 公司 的 数据 包括 分 公司 的 地 址 (由 街道 、 城 市 、 州 和 邮政 编码 组 成 ) 和 电话 

号 码 。 每 个 分 公司 都 有 一 个 分 公司 编号 ， 在 整个 公司 内 部 每 个 分 公司 的 编号 都 是 唯一 的 。 每 个 

分 公司 都 有 一 些 员 工 ， 其 中 包括 一 名 经 理 。 经 理 负责 其 所 在 分 公司 的 日 常 运 转 。 公 司 员 工 的 数 

据 包 括 姓名 、 职 位 和 薪水 。 每 位 员工 都 有 一 个 员工 编号 ， 这 个 编号 在 公司 内 也 是 唯一 的 。 每 个 

分 公司 都 库存 许多 影碟 ， 影 矶 的 数据 包括 目录 编号 、 影 矶 拷贝 编号 、 影 碟 名 、 影 碟 分 类 、 每 日 

租金 、 价 格 、 状 态 以 及 主要 演员 和 导演 的 名 字 。 目 录 编 号 唯一 标识 每 张 影碟 。 然 而 大 多 数 情况 

下 ， 在 一 个 分 公司 中 ,每 张 影碟 同时 有 好 几 份 拷贝 ， 这 时 使 用 影碟 拷贝 编号 来 标识 单个 拷贝 。 

影碟 的 分 类 包括 : 动作 片 、 成 人 片 、 儿 童 片 、 文 艺 片 、 念 怖 片 或 科幻 片 。 状 态 表示 该 影碟 是 否 

还 有 可 供出 租 的 拷贝 。 在 租借 影碟 之 前 ， 客 户 必 须 先 在 本 地 的 分 公司 注册 ， 客 户 的 数据 包括 名 

字 (first name) 和 姓 (last name)、 地 址 和 注册 日 期 。 每 位 客户 都 有 一 个 在 全 公司 范围 内 唯一 的 

编号 。 注 册 成 功 后 ， 客 户 就 可 以 租借 影碟 了 ， 每 次 最 多 只 能 借 十 张 。 每 张 被 租 出 的 影碟 应 该 登 

记 出 租 编号 、 客 户 的 全 名 和 编号 、 影 碟 拷 贝 编 号 、 影 碟 名 、 每 日 租金 、 影 碟 的 租借 日 期 和 归还 

日 期 。 出 租 编号 在 整个 公司 内 是 唯一 的 。 

(a) 确定 该 影碟 出 租 公司 的 主要 实体 类 型 。 

(b) 确定 (a) 中 实体 类 型 之 间 的 主要 联系 类 型 ， 并 给 出 每 个 联系 的 ER 图 。 

(c) 为 (b) 中 每 个 联系 确定 多 重 性 约束 ， 并 在 (b) 的 ER 图 上 标识 出 每 个 联系 的 多 重 性。 

(d) 确定 实体 类 型 和 联系 类 型 的 属性 ， 并 在 (c) 的 ER 图 上 表示 出 这 些 属 性 。 

(e) 确定 每 个 GR) 实体 类 型 的 候选 关键 字 和 主 关键 字 。 

(f) 综合 (a) 一 (e)， 用 一 个 ER 图 来 表示 这 家 影碟 出 租 公 司 的 数据 需求 ， 并 请 注 明 支持 你 的 设 
计 的 所 有 假设 。 

为 下 述 每 个 描述 创建 一 个 ER 图 : 

(a) 一 个 大 的 组 织 机 构 有 几 个 员工 用 停车 场 。 

(b) 每 个 停车 场 有 唯一 的 名 字 、 位 置 、 容 量 和 层 数 ( 若 分 层 的 话 )。 

(c) 每 个 停车 场 有 寿 干 停车 位 ， 由 唯一 的 停车 位 号 指定 。 

(d) 员工 能 申请 独占 一 个 停车 位 。 每 位 员工 有 唯一 编号 、 姓 名 、 外 线 电话 号 和 驾照 号 。 

(e) 将 (a), (b), (c), (d) 综合 为 一 个 ER 图 ， 为 了 建 模 可 提供 必要 的 假设 。 

该 习题 答案 见 图 13-11. 

创建 一 个 ER 图 描述 图 书馆 数据 。 

图 书馆 为 读者 提供 图 书 。 每 本 书 有 题目 、 版 本 、 出 版 年 份 和 一 个 唯一 的 ISBN 号 。 每 个 读者 有 

姓名 、 地 址 和 唯一 的 读者 编号 。 每 本 书 都 有 若干 副本 ， 每 个 副本 都 有 一 个 副本 编号 、 说 明 其 可 

否 借阅 的 状态 和 可 借阅 期 限 。 一 个 读者 可 借阅 多 本 图 书 ， 每 本 书 的 借 出 和 归还 日 期 都 会 记录 下 

来 。 借 阅 号 唯一 确定 每 本 图 书 的 一 次 借阅 。 

该 习题 答案 见 图 13-12。 
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本 章 我 们 主要 学 习 : 

o 实体 -联系 (ER) 模型 基本 概念 的 局 限 性 ， 以 及 使 用 其 他 数据 建 模 的 概念 来 表达 更 
加 复杂 的 应 用 的 需求 

o 增强 实体 - 联系 模型 (EER) 中 几 个 最 有 用 的 数据 建 模 概念 ， 即 特殊 化 / 泛 化 、 聚 合 
和 组 合 


o 使 用 统一 建 模 语 言 (UML) 的 图 形 化 技术 表示 EER 图 中 的 特殊 化 / 泛 化 、 聚 合 和 组 合 


在 第 12 章 我 们 讨论 了 实体 -联系 (Entity-Relationship，ER) 模型 的 基本 概念 。 对 于 一 
些 传统 的 、 基 于 管理 的 数据 库 系 统 ， 如 库存 管理 、 产 品 订购 和 客户 购 货 计价 系统 ， 使 用 这 些 
基本 概念 来 建立 系统 的 数据 模型 已 经 足够 。 然 而 ， 自 20 世纪 80 年 代 以 来 ， 许 多 新 型 数据 
库 系 统 的 开发 出 现 了 快速 的 增长 ， 与 传统 的 应 用 系统 相 比 ， 这 些 系统 对 数据 库 提出 了 更 多 
需求 。 这 些 数据 库 应 用 系统 包括 计算 机 辅助 设计 (Computer-Aided Design，CAD)、 计 算 机 
辅助 制造 ( Computer-Aided Manufacturing，CAM)、 计 算 机 辅助 软件 工程 ( Computer-Aided 
Software Engineering, CASE) 工具 、 办 公信 息 系 统 ( Office Information System, OIS) 和 多 
媒体 系统 、 数 字 出 版 和 地 理 信 息 系 统 ( Geographical Information System, GIS) 等 。 这 些 应 
用 的 主要 特征 将 在 第 27 章 讲 述 。 由 于 只 使 用 ER 建 模 的 基本 概念 已 经 无 法 充分 地 表示 这 些 
新 的 复杂 应 用 ， 因 而 也 就 促进 了 新 的 语义 建 模 概念 的 发 展 。 人 们 提出 了 许多 不 同 的 语义 数据 
模型 ， 其 中 一 些 最 重要 的 语义 概念 已 经 成 功 纳 入 了 最 初 的 ER 模型 。 支 持 了 语义 概念 的 ER 
模型 又 被 称 为 增强 的 实体 -联系 (Enhanced Entity-Relationship, EER) 模型 。 在 本 章 中 ， 我 
们 将 讲述 EER 模型 中 最 重要 也 是 最 有 用 的 三 个 扩展 概念 ， 即 特殊 化 / 泛 化 (specialization/ 
generalization), RA (aggregation) 和 组 合 ( composition)。 我 们 还 将 举例 说 明 如 何 使 用 统 
一 建 模 语言 (Unified Modeling Language, UML)(Booch et al.，1998 ) 来 表示 EER 图 中 的 特 
殊 化 / 泛 人 化、 聚合 和 组 合 。 我 们 已 经 在 第 12 章 介 绍 了 UML 并 用 图 形 说 明了 如 何 使 用 UML 
来 表示 ER 模型 的 基本 概念 。 


在 13.1 节 中 ,我 们 将 讨论 与 特殊 化 / 泛 化 相关 的 主要 概念 ， 并 给 出 示例 以 说 明 如 何在 
EER 图 中 用 UML 表示 这 些 概 念 。 在 13.1 节 的 最 后 ,我 们 将 通过 一 个 实例 来 讲解 如 何 使 用 
UML 将 特殊 化 / 泛 化 引入 ER 模型 。13.2 节 将 介绍 聚合 的 概念 ，13.3 节 将 讲述 组 合 的 概念 。 
我 们 给 出 了 聚合 和 组 合 的 示例 ， 并 展示 了 在 ER 模型 中 如 何 使 用 UML 来 表示 这 些 概 念 。 


13.1 特殊 化 / 泛 化 
特殊 化 / 泛 化 的 概念 是 和 一 些 特殊 的 实体 类 型 (如 超 类 ( superclass) 和 子 类 ( subclass) ) 


= 
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以 及 特殊 的 方法 (如 属性 继承 (attribute inheritance)) 密切 相关 的 。 本 节 我 们 首先 定义 什么 
是 超 类 和 子 类 ， 并 分 析 超 类 / 子 类 的 联系 。 然 后 描述 属性 继承 的 过 程 ， 并 对 特殊 化 过 程 和 泛 
化 过 程 加 以 分 析 比 较 。 接 下 来 介绍 超 类 / 子 类 联系 中 两 种 主要 的 约束 : 参与 约束 和 不 相交 约 
束 。 还 将 展示 如 何在 EER 图 中 使 用 UML 表示 特殊 化 / 泛 化 。 最 后 ， 我 们 以 DreamHome R 
例 研究 为 例 ， 讲 解 如 何 将 特殊 化 / 泛 化 引入 该 案例 的 Branch 用 户 视 图 的 ER 模型 ， 该 视图 参 
见 附录 A 和 图 12-1。 


13.1.1 超 类 和 子 类 

如 同 第 12 章 已 经 讨论 过 的 ， 一 个 实体 类 型 表示 一 些 同类 型 实体 的 集合 ， 如 实体 类 型 
Staff, Branch 和 PropertyForRent。 我 们 还 可 以 将 实体 类 型 组 织 成 包括 超 类 和 子 类 的 分 层 
结构 。 


超 类 | 其 出 现 构成 一 个 或 多 个 独立 子 集 ， 且 各 独立 子 集 均 需 在 数据 模型 中 单独 表示 为 实体 
类 型 。 


| 子 类 | 实体 类 型 的 一 个 独立 的 出 现 子 集 ， 该 子 集 需 要 在 数据 模型 中 单独 表示 。 


含有 独立 子 类 的 实体 类 型 称 为 超 类 。 例 如 ， 实 体 类 型 Sta 任 中 的 实体 成 员 可 以 分 为 
Manager (经 理 )、SalesPersonnel (销售 人 员 ) 和 Secretary (秘书 )。 也 就 是 说 ,实体 Staff 被 
视 为 超 类 ， 而 Manager, SalesPersonnel FI Secretary 则 被 视 为 Staff 的 子 类 。 超 类 和 它 的 任 
意 一 个 子 类 间 的 联系 被 称 为 一 个 超 类 / 子 类 联系 。 例 如 ，Staff/Manager 就 是 一 种 超 类 / FA 
的 联系 。 


13.1.2 超 类 / 子 类 联系 


子 类 中 的 每 个 成 员 同 样 也 是 超 类 的 成 员 。 也 就 是 说 子 类 中 的 实体 也 是 超 类 中 的 一 个 实 
体 ， 但 是 有 着 不 同 的 角色 。 超 类 和 子 类 间 的 联系 是 一 对 一 的 ， 称 为 超 类 / 子 类 联系 (参见 
12.6.1 节 )。 有 些 超 类 的 子 类 之 间 可 能 存在 重 县 ， 例 如， 一 名 员工 可 以 既是 经 理 又 是 销售 人 
员 。 在 这 个 例子 中 ，Manager 和 SalesPersonnel 是 其 超 类 Staff WAERT., 5—7 M, 
并 不 是 每 个 属于 超 类 的 成 员 都 必须 是 某 个 子 类 中 的 成 员 。 例 如 ， 有 些 员工 并 没有 确定 的 工作 
和 角色， 比如 说 该 员工 既 不 是 经 理 也 不 是 销售 人 员 。 

为 了 避免 在 一 个 实体 类 型 中 描述 那些 具有 不 同属 性 的 不 同类 型 的 员工 ， 我 们 可 以 使 用 超 
类 和 子 类 的 概念 。 例 如 ， 销 售 人 员 可 能 拥有 某 些 特殊 的 属性 ， 如 salesArea 和 carAllowance。 
如 果 在 每 个 Sta 任 实体 中 既 描述 所 有 员工 共有 的 属性 又 描述 那些 仅 与 特定 工作 角色 相关 的 特 
殊 属 性 的 话 ， 就 会 在 描述 特定 工作 的 属性 里 产生 许多 空 值 。 显 然 ， 销 售 人 员 和 其 他 员工 一 
样 ， 都 拥有 一 些 共同 的 属性 ， 如 staffNo, name, position 和 salary。 然 而 ， 当 我 们 试图 用 一 
个 实体 类 型 来 表示 所 有 的 员工 时 ， 那 些 无 法 共享 的 属性 就 带 来 了 问题 。 通 常 ， 还 存在 着 一 些 
仅 与 特定 员工 类 型 (FTX) 而 不 是 与 所 有 员工 都 相关 联 的 联系 。 例 如 ， 存 在 仅 和 销售 人 员 相 
关 的 联系 SalesPersonnel Uses Car (销售 人 员 “ 用 ”车 )。 

为 了 说 明 这 一 点 ， 我 们 考虑 关系 AllStaff， 如 图 13-1 所 示 。 这 个 关系 中 存储 了 所 有 员工 
(不 管 其 职位 如 何 ) 的 详细 信息 。 这 种 处 理 方法 带 来 的 一 个 后 果 是 : 只 有 部 分 属性 是 所 有 员工 
都 需要 填写 的 属性 ( 即 staffNo, name, position 和 salary)， 而 那些 与 特定 工作 角色 相关 的 属 
性 则 只 有 部 分 员工 需要 填写 。 例 如 ， 与 Manager 子 类 相关 的 属性 (mgrStartDate 和 bonus), 


与 SalesPersonnel 子 类 相关 的 属性 (salesArea 和 carAllowance) 以 及 与 Secretary 子 类 相关 的 
属性 (typingSpeed)， 只 有 这 些 子 类 的 成 员 才 会 有 相应 的 值 ， 也 就 是 说 ， 对 于 不 是 Manager, 
SalesPersonnel 和 Secretary 子 类 成 员 的 员工 ， 与 这 些 子 类 相关 的 属性 则 为 空 值 。 


适合 所 有 适合 分 公司 适合 销售 适合 秘书 
员工 的 属性 经 理 的 属性 人 员 的 属性 ”的 属性 


staffNo | name | salary saint bonus | sales car oe typing 
oy Area | Allowance | Speed 


John White Manager 01/02/95 2000 
SAIA | 5000 
SA2B | 3700 

2350 


Ann Beech Assistant 
图 13-1 存储 了 所 有 员工 详细 信息 的 关系 AllStaff 


Mary Martinez | Sales Manager 
Mary Howe Assistant 
Secretary 
Snr Sales Asst 

将 超 类 和 子 类 的 概念 引入 ER 模型 主要 有 两 个 原因 。 首 先 ， 为 了 避免 对 相似 的 概念 进行 
重复 的 描述 ， 因 而 也 可 以 节省 设计 人 员 的 时 间 ， 增 强 ER 图 的 可 读 性 。 其 次 ， 通 过 使 用 一 种 
很 多 人 都 非常 熟悉 的 描述 形式 为 数据 库 系统 设计 添加 了 更 多 的 语义 信息 。 例 如 , “经理 是 一 
名 员工 ”和 “平房 是 一 种 类 型 的 房产 "， 这 些 断 言 使 用 一 种 简练 的 形式 表达 了 有 意义 的 语义 


Manager 
内 容 。 


13.1.3 ”属性 的 继承 


如 前 所 述 ， 子 类 的 某 一 实体 和 超 类 的 某 一 实体 一 样 ， 都 表示 了 客观 存在 的 同一 对 象 ， 子 

类 的 实体 除了 拥有 该 子 类 特有 的 属性 外 ， 还 拥有 超 类 的 所 有 属性 。 例 如 ， 子 类 SalesPersonnel 
的 成 员 继 承 了 超 类 Staff 的 所 有 属性 ， 包 括 staffNo、name、position 和 salary， 同 时 还 具有 子 
类 SalesPersonnel 所 特有 的 属性 salesArea 和 carAllowance。 

一 个 子 类 也 是 一 类 实体 ， 因 而 子 类 也 可 以 有 一 个 或 多 个 自己 的 子 类 。 实 体 、 实体 的 子 
类 以 及 实体 的 子 类 的 子 类 等 等 ， 这 种 结构 被 称 为 类 型 层次 (type hierarchy ) 。 类 型 层次 有 多 
种 命名 ， 包 括 : 特殊 化 层次 (specialization hierarchy) (例如 Manager 是 Staff 的 一 个 特殊 
化 ) ; ZER (generalization hierarchy) (例如 Staff Æ Manager 的 谤 化 ); 1S-A 层次 (例如 
Manager IS-A Staff， 即 Manager 是 Staff 的 一 个 成 员 )。 下 节 将 讲述 特殊 化 与 泛 化 。 

一 个 子 类 有 不 止 一 个 超 类 时 ， 称 这 个 子 类 为 共享 子 类 。 也 就 是 说 ， 共 享 子 类 中 的 成 员 必 
须 是 其 所 有 超 类 的 成 员 。 由 此 可 知 ， 这 些 超 类 的 属性 都 将 被 共享 子 类 继承 ， 同 时 共享 子 类 还 
可 能 拥有 自己 的 属性 ， 这 种 继承 称 为 多 重 继承 。 


13.1.4 ”特殊 化 过 程 
| 特殊 化 | 通过 标识 实体 成 员 间 的 差异 特征 而 将 这 些 成 员 间 的 差异 最 大 化 的 过 程 。 


特殊 化 是 一 种 自 上 向 下 的 、 定 义 超 类 及 其 相关 子 类 的 方法 。 这 些 子 类 的 定义 建立 在 超 类 
中 实体 之 间 差 异 特征 的 基础 之 上 。 当 为 某 一 实体 类 型 确定 其 子 类 时 ， 我 们 在 属性 和 每 一 个 子 
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类 之 间 建 立 明 确 的 关联 (必要 时 )， 并 确定 所 有 子 类 与 其 他 实体 类 型 或 其 他 子 类 之 间 的 联系 
(必要 时 )。 例 如 ， 考 虑 这 样 一 个 模型 ， 在 模型 中 所 有 的 员工 都 用 一 个 实体 Staff 来 表示 。 如 
果 对 Staff 实体 应 用 特殊 化 过 程 ， 我 们 需要 确定 该 实体 成 员 之 间 的 差异 ， 如 成 员 所 特有 的 属 
性 或 联系 。 如 前 所 述 ， 员 工 可 以 具有 不 同 的 角色 ， 如 经 理 、 销 售 人 员 和 秘书 ， 而 不 同 角 色 的 
员工 又 各 自 拥有 某 些 特定 的 属性 ， 因 此 我 们 就 将 Staff 特殊 化 为 Manager、SalesPersonnel 和 
Secretary， 其 中 ，Staff 为 超 类 ，Manager、SalesPersonnel 和 Secretary 为 Staff 的 子 类 。 


13.1.5 WNF 
| 泛 化 | 通过 标识 实体 成 员 间 的 共同 特征 而 将 这 些 成 员 间 的 差异 最 小 化 的 过 程 。 


泛 化 是 一 种 自 下 向 上 的 方法 ， 泛 化 的 结果 就 是 从 初始 的 实体 类 型 中 标识 出 一 个 泛 化 的 
超 类 。 例 如 ， 考 虑 这 样 一 个 模型 ， 在 模型 中 Manager、SalesPersonnel 和 Secretary 分 别 
被 表示 为 独立 的 实体 类 型 。 如 果 要 对 这 些 实体 类 型 进行 泛 化 ， 就 需要 标识 出 这 些 实体 所 共 
有 的 属性 和 联系 。 前 面 已 经 提 到 这 些 实体 共享 那些 所 有 员工 都 具有 的 共同 属性 ， 所 以 可 以 
将 Manager, SalesPersonnel 和 Secretary 泛 化 为 Staff， 其 中 Manager、SalesPersonnel 和 
Secretary 为 子 类 ，Staff 为 超 类 。 

由 于 泛 化 过 程 可 以 看 作 特 殊 化 过 程 的 逆 过 程 ， 所 以 称 这 种 建 模 概念 为 “特殊 化 / 泛 化 ”。 
特殊 化 / 泛 化 的 图 形 化 表示 

UML 用 一 种 特殊 的 符号 来 表示 特殊 化 / 泛 化 。 例 如 ， 考虑 将 实体 Staff 特殊 化 / 泛 化 为 
表示 不 同 工 作 角色 的 子 类 。 超 类 Staff 与 其 子 类 Manager、SalesPersonnel 和 Secretary 的 增 
强 的 实体 -联系 (EER) 图 如 图 13-2 所 示 。 注 意 ，Sta 人 f 超 类 和 它 的 子 类 都 是 实体 ， 都 用 所 
形 表示 。 这 些 子 类 通过 线 连接 到 一 个 指向 超 类 的 三 角形 。 在 代表 特殊 化 / 泛 化 的 三 角形 下 方 
WMA {Optional，And} 字样 ， 这 是 表示 超 类 和 子 类 之 间 联 系 的 约束 ， 这 些 约束 将 在 13.1.6 节 
详细 讨论 。 


branchNo {PK} 
address 
street 
ci 
postcode 


Staff 


staffNo {PK} 
name 






















position 
salary 





À 
Manages {Optional, And} 


SalesPersonnel 


salesArea 
carAllowance 







Manager Secretary 









mogrStartDate 


DONUS typingSpeed 


图 13-2 将 实体 Staff 特殊 化 / 泛 化 为 表示 不 同 工 作 角色 的 子 类 
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在 表示 子 类 的 矩形 的 下 面部 分 列 出 了 该 子 类 所 特有 的 属性 。 例 如 ， 只 有 子 类 SalesPersonnel 
才 拥 有 属性 salesArea 和 carAllowance， 而 子 类 Manager 和 Secretary 则 没有 这 些 属 性 。 同 
样 ， 在 表示 Manager 和 SalesPersonnel 的 矩形 中 也 列 出 了 它们 所 特有 的 属性 ， 其 中 Manager 
独 有 mgrStartDate 和 bonus 属性 ， 而 Secretary 子 类 则 独 有 typingSpeed 属性 。 

在 表示 超 类 的 矩形 的 下 面部 分 列 出 了 其 所 有 子 类 共有 的 属性 ， 如 属性 stafftNo、name、 
position 和 salary 是 所 有 员工 都 具有 的 属性 ， 故 作为 超 类 Staff 的 属性 。 注 意 ， 在 EER 图 
中 可 以 标 出 那些 仅 适 用 于 特定 子 类 的 联系 。 例 如 ， 在 图 13-2 中 ， 子 类 Manager 通过 联系 
Manages 与 实体 Branch 关联 起 来 ， 而 超 类 Staff 则 被 通过 联系 Has 与 实体 Branch 关联 。 

根据 不 同 的 差异 特征 可 以 将 同一 实体 进行 多 种 形式 的 特殊 化 。 例 如 ， 我 们 还 可 以 根 
据 员 工 雇 用 合同 的 不 同类 型 将 实体 Staff 特殊 化 为 FullTimePermanent (全 职 固定 ) T% M 
PartTimeTemporary (临时 兼职 ) 子 类 。 图 13-3 显示 了 根据 工作 角色 和 雇用 类 型 对 实体 Staff 
进行 特殊 化 的 结果 。 在 图 中 还 列 出 了 子 类 FullTimePermanent 和 子 类 PartTimeTemporary 所 特 
有 的 属性 ， 其 中 FullTimePermanent 子 类 有 salaryScale 和 holidayAllowance 属性 ，PartTime- 
Temporary 子 类 有 hourlyRate 属性 。 


branchNo {PK} staffNo {PK} 
address name 

street position 

city salary 


ostcode 
ZX ZX 










{Optional, And} {Mandatory, Or} 


SalesPersonnel FuliTimePermanent PartTimeTemporary 


salesArea salaryScale 
syle aetna holidayAllowance hourlyRate 


雇用 合同 子 关 















图 13-3 ”将 实体 Staff 特殊 化 / 泛 化 为 表示 不 同 工 作 角色 和 不 同 雇用 类 型 的 子 类 


如 前 所 述 ， 超 类 、 超 类 的 子 类 以 及 超 类 的 子 类 的 子 类 ， 等 等 ， 这 样 的 结构 被 称 为 类 型 
层次 。 图 13-4 显示 了 一 个 类 型 层次 的 示例 ， 该 示例 扩展 了 图 13-2 中 的 基于 工作 角色 的 特殊 
化 / 泛 人 化， 出现 了 一 个 共享 子 类 SalesManager， 并 且 为 子 类 Secretary 扩展 了 一 个 自己 的 子 类 
AssistantSecretary。 也 就 是 说 ， 共 享 子 类 SalesManager 的 成 员 也 必须 是 SalesPersonnel 子 类 和 
Manager 子 类 的 成 员 ， 同 样 也 应 该 是 超 类 Staff 的 成 员 。 由 此 可 知 ， 子 类 SalesManager 继承 了 
HÆ Staff 的 属性 (stafftNo ,name position 和 salary)、 子 类 SalesPersonnel 的 属性 (salesArea 
和 carAllowance) 以 及 子 类 Manager 的 属性 ( mgrStartDate 和 bonus)， 同 时 SalesManager 还 拥 
有 自己 的 属性 SalesTarget。 

AssistantSecretary 是 Secretary 的 子 类 ， 而 Secretary 又 是 Sta 任 的 子 类 ， 这 意味 着 子 
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类 AssistantSecretary 的 成 员 必 须 也 是 子 类 Secretary 和 超 类 Sta 任 的 成 员 。 由 此 可 知 ， 子 类 
AssistantSecretary 继承 了 超 类 Staff MRE (staffNo, name, position 和 salary) 和 子 类 Secretary 
的 属性 (typingSpeed)， 除 此 之 外 ， 子 类 AssistantSecretary 还 有 自己 所 独 有 的 属性 startDate, 


branchNo {PK} staffNo {PK} 
name 
position 
salary 













{Optional, And} 


marStartDate salesArea ' 
\A N 人 人 


{Optional} 


AssistantSecretary 
salesTarget ger Sg = startDate 
Wis: ape 从 4 可 


图 13-4 将 实体 Staff 特殊 化 / 泛 化 为 表示 不 同 工 作 角 色 的 子 类 : 一 个 共享 子 类 SalesManager 
和 一 个 Secretary 子 类 以 及 Secretary 的 一 个 子 类 AssistantSecretary 


13.1.6 ”特殊 化 / 泛 化 的 约束 
对 于 特殊 化 / 泛 化 来 说 ， 共 有 两 类 约束 ， 即 参与 约束 和 不 相交 约束 。 
参与 约束 


| 参与 约束 | 限定 每 个 超 类 的 成 员 是 否 一 定 是 某 个 子 类 的 成 员 。 


-参与 约束 可 以 是 强制 的 (mandatory) 或 者 可 选 的 (optional) 。 一 个 强制 参与 的 超 类 / 
子 类 的 联系 就 限定 了 每 个 超 类 的 成 员 必 须 也 是 某 个 子 类 的 成 员 。 为 了 表示 强制 参与 ， 将 
”Mandatory” 用 大 括号 括 起 来 ， 放 在 指向 超 类 的 三 角形 的 下 面 。 例 如 ， 图 13-3 中 基于 雇用 
合同 的 特殊 化 / 泛 化 就 是 强制 参与 ， 这 就 意味 着 每 个 员工 都 必须 有 雇用 合同 。 

具有 可 选 参与 的 超 类 / 子 类 的 联系 表示 超 类 的 成 员 并 不 一 定 也 是 其 子 类 的 成 员 。 为 了 表示 
可 选 参与 ， 将 “Optional ”用 大 括号 括 起 来 ， 并 放 在 指 回 超 类 的 三 角形 的 下 面 。 例 如 ， 图 13-3 
中 基于 工作 角色 的 特殊 化 / 泛 化 是 可 选 参 与 ， 这 意味 着 存在 这 样 的 员工 ， 他 的 工作 角色 既 不 
是 经 理 ， 也 不 是 销售 人 员 或 者 秘书 。 


不 相交 约束 


不 相交 约束 | 描述 子 类 成 员 之 间 的 联系 ， 说 明了 超 类 的 某 一 成 员 是 仅 为 一 个 还 是 同时 为 多 
个 子 类 的 成 员 。 


“NA {Optional} 
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只 有 当 一 个 超 类 拥有 不 止 一 个 子 类 时 ， 不 相交 约束 才 有 意义 。 如 果 这 些 子 类 是 不 相交 
的 ,那么 一 个 Sta 任 实体 出 现 只 能 是 一 个 子 类 的 成 员 。 在 表示 不 相交 的 超 类 / 子 类 联系 时 ， 
在 大 括号 中 的 参与 约束 后 面 添加 标记 “Or”。 例 如 ， 在 图 13-3 中 基于 雇用 合同 的 特殊 化 / 泛 
化 产生 的 子 类 之 间 是 不 相交 的 ， 这 说 明 一 名 员工 和 公司 要 么 签 了 一 份 全 职 固定 合同 ， 要么 签 
了 一 份 兼职 临时 合同 ， 不 可 能 同时 签署 两 种 合同 。 

如 果 特 殊 化 / 泛 化 的 子 类 不 是 不 相交 的 ( 称 为 非 不 相交 )， 那 么 一 个 实体 出 现 就 可 以 同 
时 为 多 个 子 类 的 成 员 。 在 表示 非 不 相交 的 超 类 / 子 类 联系 时 ， 在 大 括号 括 起 来 的 参与 约束 
后 面 添加 标记 “And”。 例 如 ， 图 13-3 中 基于 工作 角色 的 特殊 化 / 泛 化 是 非 不 相交 的 ， 这 
就 意味 着 一 个 Staff 实 体 出 现 可 以 同时 是 子 类 Manager、SalesPersonnel 和 Secretary 的 成 
员 ， 这 一 点 由 出 现在 图 13-4 中 的 共享 子 类 SalesManager 所 证 实 。 注 意 : 当 类 型 层次 的 某 
一 层 只 有 一 个 子 类 时 ， 就 不 必 考 虑 不 相交 约束 。 因 此 在 图 13-4 中 ，SalesManager 与 其 子 类 
AssistantSecretary 之 间 只 显示 了 参与 约束 。 

特殊 化 和 泛 化 中 的 不 相交 约束 和 参与 约束 是 相互 独立 的 ， 因 此 存在 四 类 约束 : 强制 参与 
不 相交 约束 、 可 选 参 与 不 相交 约束 、 强 制 参 与 非 不 相交 约束 、 可 选 参与 非 不 相交 约束 。 


13.1.7 基于 DreamHome 案例 研究 的 Branch 视图 特殊 化 / 泛 化 建 模 示例 


本 书 讲述 的 数据 库 设 计 方法 中 包括 一 个 可 选 步骤 (步骤 1.6 )， 即 使 用 特殊 化 / 泛 化 概念 
建立 EER 模型 。 是 否 选择 进行 这 一 步 ， 取 决 于 被 建 模 企业 需求 〈 或 部 分 企业 需求 ) 的 复杂 程 
度 ， 以 及 使 用 EER 模型 的 附加 概念 是 否 会 对 数据 库 的 设计 过 程 提供 帮助 。 

在 第 12 章 已 经 介绍 了 建立 ER 模型 一 一 DreamHome 案例 研究 的 用 户 视图 Branch 一 一 所 
必需 的 一 些 基本 概念 ， 该 模型 的 ER 图 如 图 12-1 所 示 。 本 节 将 说 明 如 何 使 用 特殊 化 / 泛 化 将 
Branch 用 户 视图 的 ER 模型 转化 为 EER 模型 。 

首先 ， 我 们 考虑 图 12-1 中 的 实体 ， 然 后 通过 分 析 和 每 个 实体 相关 联 的 属性 和 联系 来 确 
定 实体 间 的 相似 和 不 同 之 处 。 在 用 户 视 图 Branch 的 需求 规格 说 明 书 中 ， 有 几 个 实例 有 可 能 
会 用 到 特殊 化 / 泛 化 ,下面 分 别 进 行 讨 论 。 

(a) 考虑 图 12-1 中 的 实体 Staff，Sta 任 表示 所 有 的 员工 。 然 而 在 附录 A 中 给 出 的 Dream- 
Home 案例 研究 的 用 户 视图 Branch 的 需求 规格 说 明 书 中 ， 提 到 了 两 种 关键 的 工作 角色 ， 即 
经 理 和 公司 负责 人 。 在 如 何 用 最 佳 模型 表示 Staff 的 成 员 这 个 问题 上 ,我 们 有 三 种 选择 。 第 
一 种 选择 是 将 全 部 员工 泛 化 为 一 个 staff 实体 (如 图 12-1 ); 第 二 种 选择 是 建立 三 个 独立 
的 实体 Staff, Manager 和 Supervisor ; 第 三 种 选择 是 将 Staff 作 为 超 类 ， 实 体 Manager 和 
Supervisor 作为 Staff 的 子 类 。 究 竞选 择 哪 一 种 方法 , 要 根据 对 每 一 个 实体 相关 联 的 公共 属性 
及 联系 的 分 析 。 例 如 ， 实 体 Staff 的 所 有 属性 也 是 实体 Manager 和 Supervisor 的 属性 ， 并 且 
它们 都 有 相同 的 主 关键 字 staftNo。 此 外 ， 实 体 Supervisor 并 没有 其 他 的 属性 来 表示 其 工作 
角色 ， 然 而 ， 实 体 Manager 则 拥有 两 个 表示 其 工作 角色 的 属性 : mgrStartDate 和 bonus. 5 
外 ， 实 体 Manager fil Supervisor 都 分 别 参 与 了 一 些 独 立 的 联系 ， 即 Manager Manages Branch 
和 Supervisor Supervises Staff。 基 于 上 述 分 析 ， 我 们 采用 第 三 种 方法 ， 建 立 了 Manager 和 
Supervisor FÆ, mi Staff VFA EMMA, WA 13-5 所 示 。 注 意 ， 在 图 13-5 的 EER 图 中 ， 
子 类 位 于 超 类 的 上 方 ， 子 类 和 超 类 的 相对 位 置 并 没有 什么 特别 的 意义 ， 重 要 的 是 表示 特殊 化 / 
泛 化 的 三 角形 应 指 癌 超 类 。 

对 实体 Staff 的 特殊 化 / 泛 化 的 约束 是 可 选 约 束 和 不 相交 约束 (标记 为 {Optional，Or})， 
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表示 并 非 所 有 的 员工 都 是 经 理 或 公司 负责 人 ， 同 时 一 名 员工 不 能 同时 既是 经 理 又 是 公司 负 
责 人 。 在 表示 这 些 子 类 与 超 类 Staff 的 公共 属性 以 及 那些 与 子 类 相关 联 的 联系 (如 Manager 
Manages Branch 和 Supervisor Supervises Staff) 时 ， 这 种 表示 方法 特别 有 用 。 







Supervises 
Yy 


NA, 
Staff 





name 
position 
salary 





marStartDate . 
bonus 


{Optional, Or} 


staffNo {PK} 





Manager 


















branchNo {PK} 
address 

street 

city 


postcode 












图 13-5 #828 Staff 及 其 子 类 Supervisor 和 Manager 


(b) 接 下 来 考虑 房产 与 业主 之 间 联 系 的 特殊 化 / 泛 化 。 在 视图 Branch 的 数据 需求 规格 说 
明 书 中 描述 了 两 类 业主 ， 即 PrivateOwner 和 BusinessOwner， 如 图 12-1 所 示 。 同样 ， 在 考虑 
如 何 对 业主 进行 最 佳 建 模 时 ， 也 有 三 种 选择 : 第 一 种 是 建立 两 个 独立 的 实体 PrivateOwner 
和 BusinessOwner (如 图 12-1); 第 二 种 是 将 两 种 类 型 的 业主 泛 化 成 Owner 实体 ; 第 三 种 是 
将 PrivateOwner 和 BusinessOwner 视 为 子 类 ， 而 将 Owner 作为 它们 的 超 类 。 在 决定 采用 
何 种 方法 之 前 ， 我 们 先 要 分 析 一 下 这 些 实体 的 属性 和 联系 。 实 体 PrivateOwner 和 Business- 
Owner 拥有 一 些 共同 的 属性 ， 即 address 和 telNo， 并 且 都 和 待 出 租 的 房产 之 间 存 在 相似 联 
系 〈 即 PrivateOwner POwns PropertyForRent 和 BusinessOwner BOwns PropertyForRent ) 。 


然而 ， 这 两 类 业主 还 具有 不 同 的 属性 ， 


例如 ，PrivateOwner 还 有 属性 ownerNo fil name, 


BusinessOwner 则 有 属性 bName、bType 和 contactName。 在 这 种 情况 下 ， 我 们 建立 了 一 个 


超 类 一 一 Owner 及 其 两 个 子 类 Private- 
Owner 和 BusinessOwner， 如 图 13-6 
所 示 。 

实体 Owner 的 特殊 化 / 泛 化 约 
束 是 强制 约束 和 不 相交 约束 (标记 为 
{Mandatory，Or} )， 这 意味 着 业主 要 么 
是 一 个 私人 业主 要 么 是 一 个 公司 业主 ， 
但 不 能 两 者 都 是 。 注 意 ， 超 类 Owner 和 
实体 PropertyForRent 之 间 是 通过 联系 
Owns 而 关联 起 来 的 。 

上 面 描述 的 特殊 化 / 泛 化 的 实例 是 
比较 直观 的 ， 在 下 面 的 实例 中 我 们 将 进 
一 步 讨 论 特殊 化 / 泛 化 的 过 程 。 














address 
telNo 


/ N 
{Mandatory, Or} 


PropertyForRent 


propertyNo {PK} 
address 
street 











city 
postcode 
type 
rooms 
rent 













ownerNo {PK} 
name 


BusinessOwner 


bName {PK} 
bType 
contactName 


图 13-6 HÆ Owner 及 其 子 类 PrivateOwner 和 


BusinessOwner 
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(c) 在 用 户 视图 Branch 的 数据 需求 规格 说 明 书 中 描述 了 几 类 具有 共同 特征 的 人 。 例 如 ， 
员工 、 私 人 业主 和 客户 都 有 属性 number 和 name。 于 是 我 们 就 可 以 建立 一 个 超 类 Person， 
Staff (包括 其 子 类 Manager 和 Supervisor)、PrivateOwner 和 Client 作为 Person 的 子 类 ， 如 
图 13-7 Pras. 


| number {PK} 
name 
/ \ 


{Mandatory, Or} 


position address 
salary telNo 
全 
{Optional, Or} 


mgrStartDate 
bonus 


图 13-7 超 类 Person 及 其 子 类 Staff (包括 其 子 类 Manager 和 Supervisor), PrivateOwner 和 Client 


现在 考虑 在 表示 DreamHome 案例 研究 的 用 户 视 图 Branch 时 ， 应 该 特殊 化 / 泛 化 至 何 种 
程度 。 我 们 决定 采用 (a) 和 (b) 中 的 特殊 化 / 泛 化 的 方法 ， 而 不 进行 (c) 中 所 分 析 的 特殊 
化 / 泛 人 化， 结果 如 图 13-8 所 示 ， 为 了 简化 EER 图 ， 只 列 出 了 主 关 键 字 属性 和 联系 。 在 最 终 
的 EER 模型 中 之 所 以 不 使 用 图 13-7 中 的 表示 方法 ， 是 因为 图 13-7 中 的 特殊 化 / 泛 化 过 多 强 
调 了 代表 不 同类 型 的 人 的 实体 间 的 联系 ， 而 不 是 强调 这 些 实体 与 那些 核心 实体 (如 Branch 
和 PropertyForRent) 之 间 的 联系 。 

是 否 选 择 使 用 特殊 化 / 泛 化 的 方法 ， 以 及 特殊 化 / 泛 化 到 何 种 程度 ， 都 是 一 种 主观 的 决 
Ro FLE, FEB 16 章 讨 论 的 概念 数据 库 设计 方法 学 中 ， 特 殊 化 / 泛 化 (步骤 1.6 ) 是 一 个 
可 选 步骤 。 

如 同 2.3 节 所 述 ， 数 据 模型 的 目的 是 提供 一 些 概 念 和 表示 方法 ， 从 而 使 得 数据 库 设 计 人 
员 与 终 问 用 户 可 以 就 其 各 自 对 企业 数据 的 理解 进行 明白 无 误 的 交流 。 因 而 我 们 铬 能 牢记 此 目 
标 ， 则 只 有 在 企业 数据 过 于 复杂 一 一 复杂 到 仅 使 用 ER 模型 的 基本 概念 而 难以 表达 时 ， 才 考 
虑 使 用 特殊 化 / 泛 化 这 些 附加 的 概念 。 

在 这 一 阶段 ， 可 以 考虑 一 下 在 表示 DreamHome 案例 研究 的 用 户 视图 Branch 时 ， 使 用 特 
殊 化 / 泛 化 的 方法 是 否 理想 ， 换 句 话 说， 用 户 视图 Branch 的 需求 是 表示 为 图 12-1 中 的 ER 模 
型 好 ， 还 是 图 13-8 中 的 EER 模型 好 。 这 个 问题 留 给 读者 思考 。 
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图 13-8 对 DreamHome 的 用 户 视图 Branch 特殊 化 / 泛 化 以 后 生成 的 EER 模型 
13.2 聚合 


聚合 | 表示 实体 类 型 之 间 的 “拥有 ”(has-a) 和 “属于 ”(is-part-of) 联系 ， 这 些 实体 中 有 一 
个 表示 “整体 "， 其 他 的 表示 “部 分 " 


表示 两 个 实体 类 型 之 间 关 联 的 联系 在 概念 上 是 指 同一 层次 的 实体 间 的 联系 ， 但 有 些 时 
候 ， 和 而 望 能 够 模拟 一 种 “拥有 ”或 “属于 ”类 型 的 联系 ， 在 这 些 联系 中 ， 有 一 个 实体 表示 
一 个 大 型 实体 (整体 )， 它 由 一 些小 型 实体 (部 分 ) 组 成 。 这 种 特殊 类 型 的 联系 就 称 为 聚合 
(Booch et al.，1998 )。 聚 合并 不 会 改变 “部 分 ”构成 “整体 ”的 含义 ， 也 不 会 将 “整体 ”和 
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“部 分 ”的 生存 期 联系 在 一 起 。 一 个 聚合 的 示例 为 : 将 实体 Branch (整体 ) 和 实体 Sta 任 (部 分 ) 
关联 起 来 的 联系 Has 就 是 一 种 “拥有 ”联系 。 
聚合 的 图 形 化 表示 

UML 对 聚合 的 表示 是 在 代表 联系 的 连 线 的 一 端 加 上 一 个 空心 莹 形 ， 该 端 与 表示 “ 整 
体 ”的 实体 相连 。 图 13-9 重 绘 了 图 13-8 中 的 EER 图 ,在 图 中 表示 了 聚合 。 在 该 EER 图 中 
有 两 个 聚合 ， 即 Branch Has Staff 和 Branch Offers PropertyForRent， 在 这 两 个 联系 中 ， 实 体 
Branch 代表 “整体 ”， 所 以 空心 叙 形 紧 换 Branch 一 侧 。 






Branch 


SER 







Oversees 
y 







0..100 
PropertyForRent 


propertyNo Éi 






图 13-9 ”聚合 示例 : Branch Has Staff 和 Branch Offers PropertyForRent 


13.3 AG 


组 合 | 一 种 特殊 形式 的 聚合 ， 表 示 在 实体 的 关联 中 ,“ 整 体 ” 方 对 “部 分 ” 方 拥 有 强 所 有 权 
(strong ownership )， 且 两 者 的 生存 期 相同 。 


合 完全 是 概念 上 的 ， 它 仅仅 是 为 了 区 分 “整体 ”和 “部 分 ”。 然 而 ， 存 在 一 种 聚合 的 
变形 一 一 组 合 ， 组 合 表示 了 “整体 ”对 “部 分 ”所 拥有 的 强 所 有 权 ， 并 且 “ 整 体 ” 和 “部 分 ” 
具有 一 致 的 生存 期 (Booch et al.，1998 )。 在 组 合 中 ,“ 整 体 ” 负 责 “ 部 分 ”的 部 署 ， 这 意味 
着 组 合 必须 能 够 管控 “部 分 ”的 创建 和 销毁 。 也 就 是 说 ， 在 任意 时 刻 ， 一 个 对 象 只 能 作为 某 
个 组 合 的 一 个 “部 分 ”"。 图 13-8 中 没有 组 合 的 例子 ， 为 了 便于 讨论 ， 考 虑 一 个 称 为 Displays 
的 联系 ， 该 联系 将 实体 Newspaper 和 实体 Advert 关联 起 来 。 作 为 一 个 组 合 ， 它 强调 了 这 样 
的 事实 : 一 个 Advert 实体 (部 分 ) 恰好 属于 一 个 Newspaper 实体 (整体 )。 这 一 点 和 聚合 是 
有 所 区 别 的 ， 在 聚合 中 ,“ 部 分 ”可 以 属于 多 个 “整体 ”。 例 如 ， 一 个 Staff 实体 可 能 同时 属 
于 多 个 Branch 实体 。 
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组 合 的 图 形 化 表示 

UML 对 组 合 的 表示 是 在 代表 联系 的 连 线 的 一 端 加 上 一 个 实心 菱形 ， 该 端 与 表示 “整体 ” 
的 实体 相连 。 例 如 ， 在 表示 组 合 Newspaper 
Displays Advert 时 ， 将 实心 萎 形 放置 在 联 
系 的 “整体 ”( 即 实体 Newspaper) 一 侧 ， 
如 图 13-10 所 示 。 

如 同 前 面 对 特殊 化 / 泛 化 进行 的 讨 
论 ， 是 否 使 用 聚合 与 组 合 的 方法 以 及 用 到 
何 种 程度 都 是 主观 的 决策 。 只 有 在 需要 强 
调 实 体 类 型 之 间 存 在 着 类 似 “ 具 有 ”或 
“属于 ”这 些 特殊 的 联系 时 ， 才 有 必要 使 4 
用 聚合 和 组 合 。 因 为 具有 此 类 联系 的 实体 图 13-10 组 合 示 例 : Newspaper Displays Advert 
之 间 关 联 紧密 ， 在 执行 创建 、 更 新 以 及 删除 操作 时 都 会 相互 牵连 、 相 互 影响 。 在 逻辑 数据 
库 设计 方法 学 中 将 讨论 如 何 表 示 实 体 类 型 间 的 这 类 约束 , 详 见 第 17 章 中 的 步骤 2.4。 

数据 建 模 的 目的 是 使 数据 库 设计 人 员 和 终端 用 户 可 以 将 他 们 对 企业 数据 的 理解 进行 清 
晰 、 准 确 的 交流 。 所 以 ， 只 有 在 企业 数据 需求 相当 复杂 而 且 无 法 仅 使 用 ER 模型 的 基本 概念 
进行 表达 时 ， 才 应 该 考虑 使 用 聚合 和 组 合 这 些 扩展 的 概念 。 


本 章 小 结 

o 超 类 是 这 样 一 种 实体 类 型 ， 其 出 现 构 成 了 一 个 或 多 个 独立 子 集 ， 且 各 独立 子 集 均 需 在 数据 模型 中 单 

独 表 示 。 子 类 是 某 实体 类 型 的 某 一 独立 的 出 现 子 集 ， 该 子 集 需要 在 数据 模型 中 单独 表示 出 来 。 

特殊 化 是 通过 标识 实体 成 员 间 的 差异 特征 而 将 这 些 成 员 间 的 差异 最 大 化 的 过 程 。 

泛 化 是 通过 标识 实体 成 员 间 的 共同 特征 而 将 这 些 成 员 间 的 差异 最 小 化 的 过 程 。 

与 特殊 化 / 泛 化 相关 的 约束 有 两 类 : 参与 约束 和 不 相交 约束 。 

参与 约束 限定 超 类 中 的 每 个 成 员 是 否 都 必须 是 某 一 子 类 中 的 成 员 。 

不 相交 约束 描述 了 子 类 成 员 之 间 的 联系 ， 并 指出 超 类 的 一 个 成 员 是 否 可 以 同时 为 一 个 或 多 个 子 类 的 

成 员 。 

e 聚合 表示 实体 类 型 之 间 的 “具有 ”或 “属于 ”联系 ， 其 中 ， 有 一 个 实体 类 型 代表 “整体 "， 其 他 的 
则 表示 “部 分 ”。 

e 组 合 也 表示 了 实体 之 间 的 关联 ， 是 一 种 特殊 形式 的 聚合 : 即 在 组 合 中 ， 存 在 一 个 强 所 有 权 实 体 一 一 
“整体 "， 且 “整体 ”和 “部 分 ”具有 一 致 的 生存 期 。 


思考 题 

13.1 请 描述 超 类 和 子 类 的 含义 。 

”13.2 ”描述 超 类 和 其 子 类 之 间 的 联系 。 

13.3 举例 说 明 属 性 的 继承 。 

13.4 在 ER 模型 中 引入 超 类 和 子 类 的 主要 原因 是 什么 ? 
13.5 ”描述 共享 子 类 的 含义 ,并 说 明 它 与 多 重 继承 的 关联 。 
13.6 ”描述 并 比较 特殊 化 过 程 与 泛 化 过 程 。 






Newspaper 


newspaperName 
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13.7 描述 在 特殊 化 / 泛 化 联系 上 的 两 类 主要 约束 。 
13.8 ”描述 并 比较 聚合 与 组 合 ， 并 各 举 一 例 。 


习题 


13.9 考虑 在 附录 B 给 出 的 案例 分 析 中 引入 特殊 化 / 泛 化 、 聚 合 或 组 合 这 些 增强 的 概念 是 否 合适 。 


13.10 


13.11 


13.12 


考虑 在 习题 12.12 的 案例 研究 中 ,是否 适合 引入 特殊 化 / 泛 化 、 聚 合 或 组 合 这 些 增强 的 概念 。 

如 果 适 合 ， 请 将 原 ER 图 扩展 为 带 有 这 些 增 强 概念 的 EER 图 。 

在 习题 12.13 描述 和 图 13-11 显示 的 ER 图 中 引入 特殊 化 / 泛 化 概念 ， 以 表示 下 列 信息 : 

(a) 大 多 数 车 位 为 有 顶棚 的 ， 每 个 车 位 可 分 给 一 位 员工 使 用 ,但 收取 月 租 费 。 

(b) 露天 的 停车 位 免费 ， 每 个 车 位 可 分 给 一 位 员工 使 用 。 

(c) 最 多 20 个 有 顶棚 的 停车 位 留 给 公司 来 访 者 使 用 。 然 而 ， 只 有 员工 能 预订 到 访 日 的 车 位 ， 这 
些 车 位 不 收费 ， 但 负责 预订 的 员工 需 报 出 到 访 者 的 驾照 号 。 

本 习题 的 答案 见 图 17-11。 


0..1 | spaceNo {PK} t 1..1 | parkingLotName {PK} 


location 
extension TelNo 
vehLicenseNo 





图 13-11 习题 12.13 描述 的 停车 场 问 题 的 ER 模型 


假设 扩展 习题 12.14 中 图 书馆 的 案例 ， 使 其 包括 以 下 情况 : 图 书馆 总 是 有 相当 多 库存 的 书 不 再 适 
合 外 借 。 这 些 书 能 打折 销售 。 但 也 不 是 所 有 藏书 最 后 都 能 卖 掉 ， 因 为 一 些 书 损坏 严重 ， 一 些 书 干 
脆 丢 失 了 。 每 一 本 适合 出 售 的 书 都 有 价格 和 不 再 外 借 的 日 期 。 在 习题 12.14 描述 和 图 13-12 显 
示 的 ER 图 中 引入 扩展 的 概念 ， 以 适应 对 原案 例 的 扩展 。 

本 习题 的 答案 显示 在 图 17-12。 
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ISBN {PK} 1..*| copyNo {PK} 
title status 
edition loanPeriod 
yearPublished ah 














y 
e 
borrowerNo {PK} loanNo {PK} 
name dateOut 
address dateReturned 


图 13-12 “习题 12.14 描述 的 图 书馆 问题 的 ER 模型 
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| 本 章 目标 
本 章 我 们 主要 学 习 : 
o 规范 化 的 目的 
在 设计 关系 数据 库 时 如 何 进 行规 范 化 
基本 关系 中 宛 余 数据 可 能 产生 的 问题 
描述 属性 之 间 联 系 的 函数 依赖 的 概念 
规范 化 中 所 用 函数 依赖 的 各 种 性 质 
如 何 确定 给 定 关 系 上 的 函数 依赖 
如 何 利用 函数 依赖 确定 关系 的 主 关键 字 
如 何 进行 规范 化 
规范 化 是 如 何 利 用 函数 依赖 将 属性 重组 为 达到 范式 要 求 的 关系 
如 何 判 断 最 常用 的 范式 ， 即 第 一 范式 (1NF)、 第 二 范式 (2NF)、 第 三 范式 (3NF) 
违反 了 INF、2NF 或 者 3NF 规则 的 关系 存在 的 问题 
如 何 用 规范 化 方法 将 属性 表示 为 满足 3NF 的 关系 


为 企业 设计 数据 库 时 ， 主 要 目标 是 正确 地 表示 数据 、 数 据 之 间 的 联系 以 及 与 企业 业务 相 
关 的 数据 约束 。 为 了 实现 这 个 目标 ,我 们 可 以 使 用 一 种 或 多 种 数据 库 设计 技术 。 第 12 章 和 
第 13 章 中 ,讲述 了 其 中 的 一 种 技术 一 一 实体 -联系 (ER) 建 模 。. 本 章 和 下 一 章 将 讲述 另外 
一 种 数据 库 设计 技术 一 一 规范 化 。 

规范 化 是 一 种 数据 库 设 计 技 术 ， 从 分 析 属 性 之 间 的 联系 〈( 即 函数 依赖 ) 入 手 。 属 性 刻 
画 了 企业 重要 数据 的 特性 或 者 这 些 数据 之 间 联 系 的 特性 。 规 范 化 使 用 一 系列 测试 (描述 为 
范式 ) 帮助 我 们 确定 这 些 属性 的 最 佳 组 合 ， 最 终生 成 可 支持 企业 数据 需求 的 一 组 适当 关系 。 

本 章 的 主要 目标 是 介绍 函数 依赖 的 概念 ， 并 且 讨 论 如 何 将 关系 规范 化 到 第 三 范式 。 在 第 
15 章 ， 我 们 还 将 给 出 函数 依赖 的 形式 化 描述 以 及 比 3NF 更 高 的 范式 。 
| 本 章 结构 

14.1 节 将 讲述 规范 化 的 目的 。14.2 节 将 讨论 如 何 使 用 规范 化 技术 支持 关系 数据 库 设 计 。 
14.3 节 将 分 析 并 举例 说 明 在 非 规范 化 的 基本 关系 中 数据 元 余 带 来 的 潜在 问题 。14.4 节 定 义 了 
与 规范 化 相关 的 主要 概念 一 一 函数 依赖 ， 函 数 依 赖 描述 了 属性 之 间 的 联系 ,我 们 还 将 讲述 规 
范 化 中 用 到 的 函数 依赖 的 性 质 。14.5 节 对 规范 化 进行 了 概述 。 在 后 面 的 小 节 中 分 别 讲述 了 使 
用 三 种 最 常用 范式 的 规范 过 程 : 14.6 节 讲 述 第 一 范式 ，14.7 节 讲 述 第 二 范式 ，14.8 节 讲述 第 
三 范式 。 在 上 述 小 节 中 ， 对 2NF 和 3NF 的 讨论 都 是 基于 关系 的 主 关键 字 。14.9 节 则 基于 关 
系 的 所 有 候选 关键 字 给 出 了 2NF 和 3NF 的 一 般 化 定义 。 

本 章 中 所 用 到 的 例子 取 自 11.4 节 描 述 的 DreamHome 案例 ， 在 附录 A 中 有 DreamHome 
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的 详细 文档 。 
14.1 规范 化 的 目的 


| 规范 化 | 生成 一 组 既 具 有 所 期 望 的 特性 又 能 满足 企业 数据 需求 的 关系 的 技术 。 


进行 规范 化 ( normalization) 的 目的 是 确定 一 组 合适 的 关系 以 支持 企业 的 数据 需求 。 所 
谓 合适 的 关系 ， 应 具有 如 下 性 质 : 

o 属性 的 个 数 最 少 ， 且 这 些 属 性 是 支持 企业 的 数据 需求 所 必需 的 。 

© 具有 权 密 逻辑 联系 《描述 为 函数 依赖 ) 的 诸 属性 均 在 同一 个 关系 中 。 

e 最 少 的 元 余 ， 即 每 个 属性 仅 出 现 一 次 ， 作 为 外 部 关键 字 (参见 4.2.5 节 ) 的 属性 除外 。 

连接 相关 关系 必须 用 到 外 部 关键 字 。 

数据 库 拥有 一 组 合适 关系 的 好 处 是 : 数据 库 易于 用 户 访 问 ， 数 据 易 于 维护 ， 在 计算 机 上 

占有 较 小 的 存储 空间 。 而 使 用 未 能 被 适当 规范 化 的 关系 带 来 的 问题 详 见 14.3 节 。 


14.2 ”规范 化 对 数据 库 设 计 的 支持 

规范 化 是 一 种 能 够 应 用 于 数据 库 设 计 任 何 阶段 的 形式 化 技术 。 本 节 着 重 强调 规范 化 的 两 
种 使 用 方法 (参见 图 14-1 ) 。 方 法 1 将 规范 化 视 为 一 种 自 下 而 上 的 独立 的 数据 库 设计 技术 。 
方法 2 则 将 规范 化 作为 一 种 确认 技术 使 用 : 用 规范 化 技术 检验 关系 的 结构 ， 而 这 些 关系 的 建 
立 可 能 采用 自 上 而 下 的 方法 ， 比 如 ER 建 模 。 不 管 使 用 哪 一 种 方法 ， 目 标 都 是 一 致 的 ， 即 建 
立 一 组 设计 良好 (well-designed) 的 关系 以 满足 企业 的 数据 需求 。 





ER 模型 被 映射 为 一 组 关系 





图 14-1 如何 使 用 规范 化 技术 支持 数据 库 设 计 
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图 14-1 给 出 了 一 些 能 够 用 来 进行 数据 库 设 计 的 数据 源 示 例 。 尽 管用 户 的 需求 规格 说 明 
(参见 10.5 节 ) 是 首选 的 数据 源 ， 但 是 仅 基 于 直接 从 其 他 数据 源 获得 的 信息 进行 数据 库 设 计 
也 是 可 能 的 ， 这 些 数据 源 包括 表单 和 报表 ( 详 见 本 章 及 下 章 )。 图 14-1 还 说 明 对 同一 个 数据 
源 两 种 方法 均 适 用 。 然 而 尽管 理论 上 如 此 ， 实 际 操作 时 究竟 采用 哪 一 种 方法 要 取决 于 数据 源 
反映 出 的 数据 库 的 大 小 、 范 围 以 及 复杂 度 ， 同 时 还 取决 于 数据 库 设计 者 的 偏好 及 其 专长 。 是 
否 将 规范 化 作为 一 种 自 下 而 上 的 独立 的 数据 库 设计 技术 ( 即 方法 1 ) 使 用 ， 常常 受 限于 数据 
库 设计 者 对 设计 细节 的 掌握 程度 。 然 而 ， 当 我 们 将 规范 化 作为 一 种 确认 技术 ( 即 方法 2) 使 
用 时 ， 就 没有 了 这 种 限制 。 因 为 在 这 种 使 用 方法 中 ,数据库 设计 者 在 任何 时 刻 都 仅 需 专注 于 
数据 库 的 一 部 分 ， 例 如 一 个 单一 的 关系 ， 因 此 ， 不 管 数据 库 的 大 小 或 者 复杂 度 如 何 ， 规 范 化 
都 能 够 发 挥 效能 。 


14.3 ”数据 元 余 与 更 新 异常 


如 14.1 节 所 述 ， 关 系数 据 库 设 计 的 一 个 主要 目标 就 是 将 属性 组 合成 关系 时 力求 最 少 的 
数据 元 余 。 如 果 能 够 达到 这 个 目标 ， 就 可 能 为 数据 库 讲 来 以 下 好 处 : 
© 能 用 最 少 的 操作 完成 对 数据 库 中 存储 数据 的 更 新 ， 由 此 可 以 降低 数据 库 中 出 现 数据 


不 一 致 的 概率 。 Staff 
o 减少 存储 基本 关系 所 需 的 文件 存储 空 eo ENE : 
当然 ， 关 系数 据 库 (的 运行 ) 也 依赖 于 一 定 ert 
的 数据 元 余 的 存在 。 这 种 完 余 一 般 是 以 主 关键 eh i 
字 (或 者 候选 关键 字 ) 的 多 个 副本 的 形式 出 现 ， 和 alee 


这 些 副本 在 与 之 相关 联 的 关系 ( 即 主 关键 字 或 JulieLee | Assistant 
候选 关键 字 所 属 关系 ) 中 ， 作 为 外 部 关键 字 出 
现 ， 用 以 表示 数据 之 间 的 联系 。 , 

本 节 将 通过 对 图 14-2 中 的 关系 Staff, Branch 上 
与 图 14-3 中 的 关系 StaffBranch 的 比较 ， 说 明 不 eee 
必要 的 数据 元 余 带 来 的 问题 。 关 系 StaffBranch 是 163 Main St, Glasgow 
KF Staff 和 Branch 的 另 一 种 表达 方式 ， 这 些 关 
系 的 结构 如 下 所 示 : 

Staff (staffNo, sName, position, salary, branchNo) 

Branch (branchNo, bAddress) 

StaffBranch (staffNo, sName, position, salary, branchNo, bAddress) 

注意 ， 每 个 关系 的 主 关 键 字 都 有 下 划 线 。 

在 关系 StaffBranch 中 存在 元 余数 据 : 同一 个 分 公司 的 信息 在 每 一 个 属于 该 分 公司 的 员 
工 的 信息 里 反复 出 现 。 相 反 ， 在 关系 Branch 中 ， 每 个 分 公司 的 信息 只 出 现 了 一 次 ， 而 且 在 
关系 Sta 任 中 只 有 分 公司 的 编号 (branchNo) 这 一 属性 的 值 重 复出 现 ， 这 是 为 了 能 够 表示 出 
每 一 个 员工 都 归属 于 哪 一 个 分 公司 。 存 在 元 余数 据 的 关系 可 能 存在 一 些 问题 一 一 更 新 异常 ， 
更 新 异常 又 可 分 为 插入 异常 、 删 除 异常 和 修改 异常 。 





图 14-2 关系 Staff 和 Branch 
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StaffBranch 


pane Jaer pe er perane aae 


John White | Manager 22 Deer Rd, London 
Ann Beech | Assistant 163 Main St, Glasgow 


David Ford | Supervisor 163 Main St, Glasgow 
Mary Howe | Assistant 16 Argyll St, Aberdeen 
Susan Brand | Manager 163 Main St, Glasgow 
Julie Lee Assistant 22 Deer Rd, London 





图 14-3 关系 StaffBranch 


14.3.1 插入 异常 


插入 异常 主要 有 两 类 ， 我 们 用 图 14-3 中 的 关系 StaffBranch 来 解释 这 两 类 异常 。 

e 在 关系 StaffBranch 中 插入 一 位 新 员工 的 信息 时 ， 这 些 信息 中 必须 包括 该 员工 将 被 分 
配 到 的 分 公司 的 信息 。 比 如 ， 在 插入 某 一 被 分 配 到 编号 为 B007 的 分 公司 工作 的 员 
工 信 息 时 ， 我 们 必须 正确 输入 分 公司 B007 的 所 有 信息 ， 由 此 确保 这 些 数据 与 关系 
StaffBranch 已 有 的 关于 分 公司 B007 的 元 组 中 的 信息 一 致 。 图 14-2 中 的 关系 则 不 存 
在 这 种 潜在 的 不 一 臻 性， 因为 在 关系 Staff 中 ， 只 需 为 每 个 员工 录入 相应 的 分 公司 编 
号 就 可 以 了 ， 而 在 关系 Branch 中 ,编号 为 B007 的 分 公司 的 信息 是 作为 一 个 单独 的 
元 组 存储 在 数据 库 中 的 。 

e 在 问 关系 StaffBranch 中 插入 一 个 新 的 分 公司 的 信息 时 ， 由 于 该 分 公司 目前 可 能 还 没 
有 员工 ， 因 此 有 必要 在 录 人 与 员工 相关 的 信息 时 将 其 设 为 null， 如 将 staffNo 赋值 为 
null。 但 是 staffNo 是 关系 StaffBranch 的 主 关键 字 ， 知 试图 为 staffNo 录入 null 但， 
则 会 违反 实体 完整 性 约束 (参见 4.3 节 )， 这 样 做 是 不 允许 的 ， 我 们 也 因此 无 法 问 关 
系 StaffBranch 中 插入 一 个 staffNo 为 null 的 一 个 新 的 分 公司 的 元 组 。 图 14-2 中 的 关 
系 设 计 则 避免 了 此 类 问题 的 出 现 ， 因 为 分 公司 的 信息 在 关系 Branch 中 单独 录入 ,与 
员工 信息 分 离 ， 而 员工 被 分 配 到 哪个 分 公司 工作 的 信息 则 会 在 以 后 的 时 间 再 录入 关 
系 Staff 中 。 


14.3.2 ”删除 异常 


在 从 关系 StaffBranch 中 删除 一 个 元 组 时 ， 若 该 元 组 表示 某 分 公司 最 后 一 名 员工 ， 则 删 
除 元 组 之 后 ， 该 分 公司 的 信息 也 从 数据 库 中 丢失 了 。 例 如 ， 如 果 从 关系 StaffBranch 中 删除 
员工 编号 为 SA9 (员工 Mary Howe) 的 元 组 ， 则 编号 为 B007 的 分 公司 的 信息 也 将 从 数据 库 
中 消失 。 图 14-2 的 关系 设计 则 避免 了 这 个 问题 ， 因 为 表示 分 公司 的 元 组 和 表示 员工 的 元 组 
是 分 开 存储 的 ， 只 有 属性 branchNo 将 这 两 个 关系 关联 在 一 起 。 如 果 从 关系 Staff 中 删除 员工 
编号 为 SA9 的 元 组 ， 关 系 Branch 中 分 公司 B007 的 信息 并 不 会 受到 任何 影 啊 。 


14.3.3 “修改 异常 


如 果 我 们 想 要 修改 关系 StaffBranch 中 某 分 公司 的 某 个 属性 值 ， 比 如 修改 分 公司 B003 
的 地 址 ， 那 么 我 们 必须 更 新 所 有 B003 的 员工 的 元 组 。 和 若 此 修改 操作 未 能 在 关系 StaffBranch 
中 所 有 相关 的 元 组 上 执行 ， 数 据 库 则 会 产生 不 一 致 : 同属 于 分 公司 B003 的 员工 ， 其 元 组 在 
分 公司 地 址 这 一 属性 上 的 取 值 可 能 会 出 现 不 同 。 


#14e A HB Æ 313 


上 面 的 示例 说 明了 图 14-2 中 的 关系 Staff 和 Branch, HER 14-3 中 的 关系 StaffBranch A 
有 更 令 人 满意 的 特性 。 也 就 是 说 ， 当 关系 StaffBranch 发 生 更 新 异常 时 ， 我们 可 以 通过 将 其 
分 解 为 Staff 和 Branch 两 个 关系 来 避免 这 些 异 常 。 当 把 较 大 的 关系 分 解 成 较 小 的 关系 时 ， 有 
两 个 很 重要 的 特性 : 
© 无 损 连接 (lossless-join) 特性 : 该 特性 确保 了 原 关 系 的 任 一 实例 信息 能 通过 较 小 关 
系 的 对 应 实例 确定 出 来 。 
© 依赖 保持 (dependency preservation) 特性 : 该 特性 确保 了 只 需 简 单 地 在 较 小 的 关系 
上 文 持 某 些 约束 ， 就 可 以 继续 支持 在 原 关系 上 存在 的 约束 。 也 就 是 说 ， 我 们 不 必 对 
较 小 的 关系 执行 连接 操作 就 可 以 检验 它们 是 否 违 反 了 原 关 系 上 的 约束 。 
本 章 的 后 面部 分 将 讨论 如 何 使 用 规范 化 的 过 程 来 构造 结构 良好 的 关系 。 在 这 之 前 ， 首 先 
介绍 函数 依赖 的 概念 ， 这 是 规范 化 过 程 的 基础 。 


14.4 函数 依赖 


与 规范 化 相关 的 一 个 重要 概念 就 是 函数 依赖 (functional dependency), AURK MTA T 
属性 之 间 的 联系 (Maier，1983 )。 本 节 首 先 讲述 函数 依赖 的 概念 ， 然 后 讲述 对 规范 化 来 说 非 
常 有 用 的 函数 依赖 的 性 质 ， 最 后 讨论 如 何 识别 函数 依赖 以 及 如 何 使 用 函数 依赖 确定 关系 的 主 
关键 字 。 


14.4.1 Bere MATE 


为 了 讨论 函数 依赖 ,假设 有 某 一 关系 模式 ， 该 关系 模式 具有 属性 (A, B, C, …, Z), 
我 们 用 一 个 全 域 关 系 (universal relation) R= (A, B, C, =, Z) 来 描述 数据 库 。 该 假设 意 
味 着 每 个 数据 库 中 的 属性 都 有 一 个 唯一 的 名 字 。 


函数 依赖 | 描述 一 个 关系 中 属性 之 间 的 联系 。 例 如 ,假设 A 和 B 均 为 关系 及 的 属性 ， 若 A 
的 每 个 值 都 和 B 中 的 一 个 唯一 的 值 相对 应 ， 则 称 B 函数 依赖 于 A， 记 为 A 一 B(A、B 可 
能 由 一 个 或 多 个 属性 组 成 )。 


函数 依赖 是 属性 在 关系 中 的 一 种 语义 特性 。 该 语义 特性 表明 了 属性 和 属性 是 如 何 关联 起 
来 的 ， 确定 了 属性 之 间 的 函数 依赖 。 当 存在 某 一 函数 依赖 时 ， 这 个 依赖 就 被 视 为 属性 之 间 的 
一 种 约束 。 

考虑 某 一 关系 ， 它 拥有 属性 A、B， 其 中 属性 B 函数 依赖 于 属性 A。 假 设 知道 A 的 值 ， 
我 们 来 验证 该 关系 是 否 支持 这 种 依赖 。 结 果 我 们 发 现 无 论 任何 时 候 ， 对 于 所 有 元 组 ， 若 属性 
A 的 值 等 于 给 定 值 ， 则 该 元 组 的 属性 B 的 值 都 是 唯一 的 。 因 此 ， 当 两 个 元 组 的 属性 A 的 值 
相同 时 ， 甚 属性 B 的 值 也 是 相同 的 。 反 之 
则 不 然 ， 对 于 一 个 给 定 的 B 的 值 ， 可 能 对 
应 着 几 个 不 同 的 A 的 值 。 属性 A、B 之 间 
的 这 种 依赖 可 以 用 图 14-4 表示 。 MAEA Bee 

另外 一 种 描述 属性 A、B 之 间 的 这 种 联系 的 术语 为 “A 函数 决定 B”。 也 许 一 些 读者 更 
喜欢 使 用 后 者 ， 因 为 它 与 属性 之 间 函 数 依赖 的 箭头 的 方向 相同 ， 显 得 更 自然 一 些 


| REA | 位 于 函数 依赖 往 头 左边 的 属性 或 属性 组 。 
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当 存在 函数 依赖 时 ， 位 于 箭头 左边 的 属性 或 属性 组 称 为 决定 方 ( determinant )。 例 如 ， 
在 图 14-4 中, A 是 B 的 决定 方 。 下 面 ， 我 们 将 举例 说 明 如 何 识别 函数 依赖 。 


| 例 14.1 >> 函数 依赖 示例 

考虑 图 14-2 中 的 关系 Sta 任 的 属性 3 
staffNo 和 position, X} FH + Ae WH e 函数 决定 position 
staffNo 值 ， 如 SL21， 我 们 就 可 以 确定 该 
员工 的 职位 是 经 理 。 也 就 是 说 ，staffNo 
PKR position， 如 图 14-5a 所 示 。 而 
图 14-5b 说 明了 反 过 来 则 是 不 正确 的 ， 
因为 position 是 无 法 函数 决定 staffNo 
的 ， 即 某 位 员工 拥有 某 一 职位 ， 但 有 可 
能 有 好 多 位 员工 都 拥有 这 一 职位 。 


员工 编号 SL21 
staffNo 和 position 之 间 的 联系 是 一 对 
一 的 (1:1): 每 位 员工 有 且 只 能 拥有 一 pai 
个 职位 。 男 一 方面 ，position 和 staffNo 之 员工 编号 SG5 


间 的 联系 是 一 对 多 的 (1:*)， 可 能 有 多 位 b) position 不 能 函数 决定 staffNo (position x> staffNo) 
员工 拥有 同一 职位 。 本 例 中 ，staffNo 是 ANA 

消 数 依赖 的 决定 方 。 为 了 进行 规范 化 ， 我 们 主要 关注 关系 中 那些 具有 一 对 一 联系 的 属性 之 间 
的 函数 依赖 ， 从 而 确定 依赖 左边 的 决定 方 和 右边 的 属性 (组 )。 

在 确定 一 个 关系 中 属性 之 间 的 函数 依赖 时 ， 必 须 明 确 它 是 仅 当 属性 取 某 一 特定 值 时 成 
立 ， 还 是 该 属性 取 值 集中 任意 值 时 均 成 立 ， 区 分 清楚 这 一 点 是 很 重要 的 。 换 名 话说， 函数 依 
赖 是 关系 模式 (AW) 的 性 质 ， 而 不 是 模式 的 某 个 实例 (外延 ) 的 性 质 (参见 3.2.1 节 )。 下 
面 就 举例 说 明 这 一 点 。 « 


| 114.2 D 恒 成 立 函 数 依赖 示例 

考虑 图 14-2 所 给 关系 Staff MIRCEA staffNo 和 sName。 可 以 看 到 ， 对 于 给 定 的 staffNo, 
如 SL21， 可 以 确定 该 员工 的 名 字 是 John White。 而 且 对 于 给 定 的 sSName， 如 John White, 
也 可 以 确定 他 的 员工 编号 是 SL21。 我 们 是 否 因此 就 能 得 出 结论 : 属性 staffNo 函数 决定 属性 
sName 或 者 属性 sName 函数 决定 属性 staffNo W? 如 果 图 14-2 所 示 关 系 Staff 的 值 表 示 了 属 
性 staffNo Al sName 所 有 可 能 的 取 值 ， 则 下 列 郴 数 依赖 是 成 立 : 


staffNo — sName 
sName — staffNo 


但 是 ， 如 果 图 14-2 所 示 Staff 关系 仅 代表 某 一 特定 时 刻 staffNo 和 sName 属性 的 取 值 集 
合 ， 那 我 们 就 没 必 要 关心 这 两 个 属性 之 间 的 联系 了 。 因 为 我 们 想 要 确定 的 函数 依赖 应 该 对 关 
系 中 所 有 可 能 的 属性 值 都 成 立 。 之 所 以 有 这 样 的 要 求 ， 是 因为 函数 依赖 代表 各 种 完整 性 约 
东 ， 这 些 约束 又 表示 对 关系 取 值 限制 的 合理 假设 。 

一 种 能 够 确定 关系 中 属性 的 所 有 可 能 的 取 值 集合 的 方法 是 完全 理解 每 个 属性 的 意义 。 例 
如 ， 属 性 staffNo 的 值 唯一 标识 了 每 一 位 员工 ， 而 属性 sName 的 值 则 代表 了 员工 的 姓名 。 很 
明显 ， 如 果 知 道 了 员工 的 员工 编号 ( staffNo)， 我 们 就 可 以 确定 该 名 员工 的 名 字 ( sName)。 
但 是 ， 由 于 员工 可 能 重 名 ， 所 以 属性 sName 就 可 能 具有 重复 值 。 对 于 这 类 员工 ， 显 然 无 法 





员工 编号 SL21  —— 经 理 
a) staffNoPh A position (staffNo 一 position) 


position 不 能 
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确定 其 员工 编号 (staffNo). staffNo 和 sName 之 间 的 联系 是 一 对 一 的 (1:1): 每 个 员工 编 
号 只 对 应 一 个 员工 姓名 。 男 一 方面 ，sName 和 staffNo 之 间 的 联系 是 一 对 多 的 (1:*): 一 
员工 姓名 可 能 对 应 着 多 个 员工 编号 。 在 考虑 了 所 有 可 能 的 属性 staffNo 和 sName 的 取 值 后 ， 
依然 成 立 的 函数 依赖 为 : 


staffNo 一 sName 《< 


另 一 个 规范 化 时 有 用 的 函数 依赖 的 性 质 是 : 决定 方 应 该 具有 最 少 的 属性 ， 这 些 属性 
是 保证 右边 的 属性 函数 依赖 于 它 所 必 不 可 少 的 。 我 们 称 其 为 完全 函数 依赖 (fall functional 
dependency ) 。 


完全 函数 依赖 | 假设 A 和 了 B 是 某 一 关系 的 属性 (组 )， 若 B 函数 依赖 于 A， 但 不 函数 依赖 于 
A 的 任 一 真子 集 ， 则 称 B 完全 函数 依赖 于 A。 


对 于 函数 依赖 A 一 B， 如 果 去 掉 A 中 的 任 一 属性 都 使 得 该 依赖 不 再 成 立 ， 那 么 A 一 B 
就 是 完全 函数 依赖 。 如 果 去 掉 A 中 的 某 些 属性 ， 依 赖 仍然 成 立 ， 那 么 函数 依赖 A 一 B 就 是 
部 分 函数 依赖 。 例 14.3 举例 说 明了 如 何 从 一 个 部 分 函数 依赖 得 到 一 个 完全 函数 依赖 。 


| 例 14.3 D 完全 函数 依赖 示例 
考虑 在 图 14-2 的 关系 Staff 上 成 立 的 函数 依赖 : 


staffNo, sName — branchNo 


A  (staffNo, sName) 值 都 和 一 个 单独 的 branchNo 相对 应 ， 这 是 对 的 ， 但 这 不 是 一 个 完 
全 函数 依赖 ， 因 为 branchNo 也 函数 依赖 于 ( staffNo，sName) 的 子 集 一 一 staffNo。 换 句 话 说 ， 
上 面 给 出 的 函数 依赖 是 一 个 部 分 依赖 。 我 们 更 感 兴趣 的 函数 依赖 是 完全 函数 依赖 ， 如 下 所 示 : 


staffNo — branchNo 


更 多 的 部 分 依赖 和 完全 依赖 的 例子 将 在 14.7 TIE « 


概括 而 言 ， 规 范 化 时 要 用 到 的 函数 依赖 具有 下 列 性 质 : 
e 卫 数 依赖 左边 的 属性 (组)( 即 决定 方 ) 与 右边 的 属性 (组 ) 是 一 对 一 的 联系 (注意 ， 
若 反 过 来 看 ， 也 就 是 右边 与 左边 的 属性 (组 ) 之 间 则 既 可 能 为 一 对 一 的 联系 ， 也 可 能 
为 一 对 多 的 联系 )。 
© 恒 成 立 。 
e 决定 方 具有 最 少 的 、 足 以 支持 与 右边 属性 (组 ) 之 间 依 赖 关 系 的 属性 ， 即 右边 的 属性 
(组 ) 完全 依赖 于 左边 的 属性 (组 )。 
St, 我们 已 经 讨论 了 在 规范 化 时 所 关心 的 一 些 函 数 依赖 ,但 是 还 有 必要 了 解 一 种 函数 
依赖 ， 即 传递 依赖 (transitive dependency)。 因 为 关系 中 若 存 在 传递 依赖 ， 就 有 可 能 引起 更 
新 异常 (参见 14.3 节 )。 本 节 只 简单 介绍 传递 依赖 ， 目 的 是 在 需要 时 我 们 能 够 识别 出 它们 。 


传递 依赖 | 假设 A、B、C 是 某 一 关系 的 属性 ， 若 A 一 B,，B 一 C， 则 称 C 通 过 B 传递 依 
tT A (假设 A 并 不 函数 依赖 于 B 或 C)。 


例 14.4 给 出 了 传递 依赖 的 示例 。 


| Bil 14.4 >> 传递 依赖 示例 
考虑 图 14-3 在 关系 StaffBranch 上 成 立 的 函数 依赖 ， 如 下 所 示 : 


staffNo 一 sName, position, salary, branchNo, bAddress 
branchNo 一 bAddress 


bAddress 通过 branchNo 传递 依赖 于 staffNo。 换 句 话 说， 属性 staffNo 通过 属性 branchNo 
pki AGE bAddress， 并 且 branchNo 和 bAddress 都 不 能 图 数 决定 staffNo。 在 14.8 节 还 将 讨论 
其 他 的 传递 依赖 的 例子 。 KC 


在 后 面 的 小 节 里 ， 我 们 将 举例 说 明 识别 函数 依赖 集 的 方法 ， 然 后 讨论 如 何 利用 这 些 依赖 
确定 示例 关系 的 主 关键 字 。 


14.4.2 ”识别 函数 依赖 


如 果 我 们 能 够 完全 理解 每 一 个 属性 的 意义 以 及 这 些 属性 之 间 的 联系 ， 那 么 确定 属性 之 
间 所 有 的 函数 依赖 应 该 非常 简单 。 这 类 信息 应 由 企业 提供 ， 可 能 是 通过 与 用 户 讨论 形成 ， 同 
时 (或 者 ) 也 可 能 是 以 文档 的 形式 出 现 ， 比 如 用 户 需 求 规格 说 明 书 。 但 是 ， 如 果 与 用 户 无 法 
沟通 ， 并 且 (或 者 ) 文档 并 不 完备 ， 那 么 数据 库 设 计 人 员 就 有 必要 基于 该 数据 库 应 用 的 领域 ， 
利用 自己 的 常识 或 经 验 来 补充 那些 缺失 的 信息 。 例 14.5 举例 说 明了 当 我 们 能 够 完全 理解 属 
性 的 意义 和 属性 之 间 联 系 时 ， 就 能 很 容易 地 确定 关系 的 属性 之 间 的 函数 依赖 。 


| 例 14.5 >> 确定 关系 StaffBranch 的 函数 依赖 集 

首先 ， 我 们 分 析 一 下 图 14-3 所 示 的 关系 StaffBranch 的 属性 的 语义 。 为 了 便于 讨论 ， 假 
设 员工 拥有 的 职位 与 其 所 在 的 分 公司 决定 了 员工 的 工资 。 基 于 对 关系 StaffBranch 中 的 属性 
的 理解 ， 确 定 下 列 函 数 依 赖 : 


staffNo — sName, position, salary, branchNo, bAddress 
branchNo 一 bAddress 

bAddress — branchNo 

branchNo, position — salary 

bAddress, position — salary 


KA StaffBranch 中 已 经 确定 的 这 五 个 函数 依赖 的 决定 方 分 别 是 : staffNo, branchNo, 
bAddress, (branchNo, position) 和 (bAddress，position ) 。 对 于 每 个 函数 依赖 来 说 ， 我 们 能 
够 确保 所 有 右边 的 属性 都 晴 数 依赖 于 左边 的 决定 方 。 « 


作为 对 比 ， 现 在 我 们 要 考虑 的 是 在 属性 的 意义 和 属性 之 间 联 系 的 信息 均 缺 乏 的 情况 下 ， 
如 何 识 别 函 数 依赖 。 在 这 种 情况 下 ， 若 有 一 些 简单 数据 可 用 ， 而 这 些 数据 又 是 数据 库 可 以 存 
储 的 所 有 可 能 数据 的 代表 ， 则 还 是 有 可 能 识别 函数 依赖 的 。 例 14.6 说 明了 这 种 方法 。 


| 例 14.6 >> 利用 案例 数据 识别 函数 依赖 

考虑 图 14-6 中 的 关系 Sample 中 的 属性 A、B、C、D、E。 首 要 的 一 点 就 是 先 要 确定 关 
系 中 已 经 给 出 的 数值 是 否 可 以 代表 属性 A、B、C、D、E 所 有 可 能 的 取 值 。 本 例 中 ， 尽 管 关 
系 中 列 出 的 数据 量 相 对 较 小 ， 我 们 还 是 假设 能 够 确保 这 一 点 。 确 定 图 14-6 中 的 关系 Sample 
的 属性 之 间 的 函数 依赖 (标记 为 fdl ~ fd5 ) 的 过 程 如 下 所 述 。 

为 了 确定 属性 A、B、C、D、E 之 间 存 在 的 函数 依赖 ， 我 们 分 析 图 14-6 中 给 出 的 关系 
Sample: 当 某 一 列 的 取 值 相 同 的 时 候 ， 看 看 其 他 列 的 取 值 情况 是 否 也 是 如 此 。 先 从 左边 第 一 
列 开 始 ， 分 析 其 与 关系 的 右边 每 一 列 的 取 值 情况 ， 然 后 再 分 析 属 性 各 种 组 合 的 情况 ， 也 就 是 
分 析 当 两 列 或 两 列 以 上 的 属性 取 值 相等 的 时 候 ， 其 他 列 的 取 值 情况 是 否 也 是 如 此 。 
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图 14-6 关系 Sample 的 属性 A、B、C、D、E 的 部 分 取 值 以 及 这 些 属性 之 间 的 函数 依赖 (fdl ~ fd5 ) 


例如 ， 当 列 A 取 值 为 “a” 时 , FC 的 值 就 为 “z”， 当 列 A 为 “e” 时 , 列 C 就 为 “r”。 
因此 可 以 得 出 结论 : 在 属性 A AC 之 间 存 在 一 对 一 的 联系 (1:1)。 也 就 是 说 ， 属 性 A 函数 
决定 属性 C， 在 图 14-6 中 该 函数 依赖 被 标记 为 函数 依赖 1 (fdl )。 更 进一步 地 说 ， 列 C 取 值 
的 变化 总 是 与 列 A 的 取 值 变化 一 致 。 我 们 还 可 以 总 结 出 属性 C 和 A 之 间 也 具有 (1:1) 的 
联系 。 也 就 是 说 ，C 函数 决定 A， 在 图 14-6 中 用 fd2 标识 。 如 果 考 虑 属性 B， 就 可 以 看 到 当 
列 B 取 值 为 “b” 或 者 “d” 时 , 列 D 的 取 值 就 为 “w”, WBA “ft” HW, 列 DD 就 为 “s”。 
因此 可 以 断定 属性 B 和 DD 之 间 具 有 (1:1) 的 联系 ， 即 B 函数 决定 D， 在 图 14-6 中 用 fd3 
标识 。 但 是 ， 属 性 D 不 能 函数 决定 属性 B， 因 为 当 属 性 D 的 取 值 都 为 同一 个 值 比 如 “w” 
时 ， 并 不 仅仅 只 对 应 着 属性 B 的 一 个 值 。 也 就 是 说 ， 当 列 D 取 值 为 “w” 时 , 列 B 的 取 值 
或 者 为 “b” 或 者 为 “d”。 因 此 ,在 属性 D 和 B 之 间 存 在 着 一 对 多 的 联系 。 最 后 一 个 要 考 
虑 的 属性 是 E。 我 们 发 现 这 一 列 和 其 他 所 有 列 的 取 值 的 变化 情况 都 不 一 致 ， 即 属性 三 不 能 函 
数 决定 属性 A、B、C 或 者 D。 

现在 考虑 组 合 属性 和 其 他 列 值 的 变化 是 否 一 致 ， 可 以 推断 出 的 是 列 A 和 列 B 的 组 合 值 
相同 时 ， 列 E 的 取 值 也 都 相同 。 比 如 : 若 列 A 和 列 B 的 取 值 为 (a，b) AT, WIPE HW “q”. 
也 就 是 说 ， 属 性 (A，B) 函数 决定 属性 下 ， 在 图 14-6 中 标识 为 ft4。 但 是 ， 反 之 不 然 ， 因 为 
我 们 前 面 已 经 说 过 属性 E 不 能 函数 决定 关系 的 任何 一 个 属性 。 同 理 可 分 析出 ， 属 性 (B, C) 
函数 决定 属性 E， 在 图 14-6 中 标识 为 fd5。 通 过 对 剩余 的 列 的 所 有 可 能 的 组 合 进行 分 析 ， 就 
完成 了 对 图 14-6 所 示 的 关系 的 函数 依赖 的 分 析 。 

小 结 一 下 ， 图 14-6 中 关系 Sample 的 属性 A 到 EE 之 间 存 在 如 下 函数 依赖 : 


A-~C (fdl) 
C 一 人 (fd2) 
B 一 D (fd3) 


A,B 一 E (fd4) 
BC 一 E (fd5) 《< 
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14.4.3 利用 函数 依赖 确定 主 关 键 字 


确定 关系 函数 依赖 集 的 主要 目的 是 确定 该 关系 必须 满足 的 完整 性 约束 集 。 首 先 要 考虑 辨 
别 的 一 种 重要 的 完整 性 约束 是 候选 关键 字 ， 候选 关键 字 中 的 一 个 将 被 选 作 关系 的 主 关 键 字 。 
下 面 的 两 个 示例 说 明了 如 何 确定 关系 的 主 关键 字 。 


| 例 14.7 >> 确定 关系 StaffBranch 的 主 关键 字 

在 例 14.5 中 我 们 讲述 了 如 何 确定 图 14-3 所 示 的 关系 StaffBranch 的 五 个 函数 依赖 。 这 些 
限 数 依赖 的 决定 方 分 别 是 : staffNo .branchNo.bAddress, (branchNo, position) 和 (bAddress, 
position). 

为 了 确定 关系 StaffBranch 的 候选 关键 字 ， 我 们 必须 确定 可 以 唯一 标识 关系 中 每 个 元 组 
的 属性 (或 属性 组 )。 如 果 一 个 关系 有 多 个 候选 关键 字 ， 我 们 将 确定 一 个 候选 关键 字 作 为 关 
系 的 主 关键 字 (参见 4.2.5 节 )。 所 有 不 属于 主 关键 字 的 属性 (non-primary-key attributes) 都 
应 该 函数 依赖 于 主 关键 字 。 

因为 关系 StaffBranch 中 其 他 所 有 属性 都 函数 依赖 于 staffNo， 而 staffNo 又 是 关系 Staff- 
Branch 唯一 的 候选 关键 字 ， 所 以 staffNo 就 是 关系 StaffBranch 的 主 关键 字 。 尽 管 branchNo、 
bAddress、(branchNo，position) 和 (bAddress, position) 在 关系 中 都 是 决定 方 ， 但 它们 都 
不 是 候选 关键 字 。 « 


| 例 14.8 >> 确定 关系 Sample 的 主 关键 字 

在 例 14.6 中 ， 我 们 已 经 确定 了 关系 Sample 的 五 个 函数 依赖 。 为 了 确定 关系 的 候选 关键 
字 ， 现 在 我 们 来 分 析 每 一 个 函数 依赖 的 决定 方 。 一 个 适合 成 为 候选 关键 字 的 决定 方 一 定 要 能 
够 函数 决定 关系 中 的 所 有 其 他 属性 。 关 系 Sample 的 决定 方 有 A、B、C、(A，B) 和 (B, C), 
但 是 ， 只 有 决定 方 (A, B) Al (B, C) 能 函数 决定 关系 Sample 中 的 所 有 其 他 属性 。 先 看 (A, 
B) 的 情形 ,A 函数 决定 C,B RARE D, (A,B) 函数 决定 E。 换 句 话说， 构成 决定 方 (A,B) 
的 属性 能 够 函数 决定 关系 中 的 所 有 其 他 属性 ， 这 里 考虑 A、B 独立 或 A、B 一 起 能 够 函数 决 
定 的 所 有 属性 。 而 关系 候选 关键 字 的 一 个 基本 的 性 质 就 是 不 管 考 虑 决定 方 的 一 个 单独 属性 还 
是 属性 的 组 合 ， 它 们 一 起 要 能 够 也 数 决定 关系 中 其 他 所 有 的 属性 才 行 。 该 性 质 对 关系 Sample 
RREN (B, C) 也 成 立 , 但 其 他 的 决定 方 (包括 A、B 或 者 C) 都 不 具备 这 个 性 质 ， 因 
为 它们 分 别 只 能 函数 决定 一 个 其 他 的 属性 。 因 此 ， 在 关系 Sample 中 有 两 个 候选 关键 字 ， 即 
(A, B) 和 (B，C)。 由 于 二 者 长 度 一 样 ( 均 为 两 个 属性 )， 所 以 可 任 选 一 个 作为 关系 Sample 
的 主 关 键 字 。 未 被 选 作 主 关键 字 的 候选 关键 字 称 为 可 替换 关键 字 (alternate keys), « 


至 此 ， 本 节 已 经 讨论 了 对 于 确定 关系 上 的 数据 约束 最 有 用 的 函数 依赖 ， 并 讨论 了 如 何 利 
用 函数 依赖 确定 关系 的 主 关键 字 (或 候选 关键 字 )。 函 数 依赖 和 关键 字 的 概念 是 规范 化 过 程 
的 核心 内 容 。 下 一 章 将 为 那些 对 形式 化 感 兴趣 的 读者 继续 讨论 函数 依赖 。 本 章 ， 我 们 将 继续 
讲述 规范 化 的 过 程 。 


14.5 ” 规 沁 化 过 程 


规范 化 是 一 种 基于 关系 的 主 关键 字 (或 者 候选 关键 字 ) 和 函数 依赖 对 关系 进行 分 析 的 形 
式 化 技术 (Codd，1972b)。 规 范 化 技术 涉及 一 系列 的 规则 ， 这 些 规则 能 够 用 来 对 关系 进行 单 
独 测试 以 保证 数据 库 可 以 被 规范 化 到 任意 程度 。 当 某 种 规范 化 的 要 求 未 能 得 到 满足 时 ， 就 将 
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违反 需求 的 关系 分 解 为 多 个 关系 ， 直 至 分 解 后 的 每 一 个 关系 都 能 满足 规范 化 的 要 求 为 止 。 

最 早 提出 的 三 个 范式 为 第 一 范式 (1NF)、 第 二 范式 (2NF) 和 第 三 范式 (3NF)。 后 来 ， 
R. Boyce Ail E. F. Codd 又 提出 了 一 种 增强 的 第 三 范式 ， 称 为 Boyce-Codd 范式 (BCNF) (Codd, 
1974 ) 。 除 了 第 一 范式 ， 所 有 这 些 范式 都 是 基于 关系 的 属性 之 间 的 函数 依赖 的 (Maier， 
1983 )。 随 后 还 提出 了 比 BCNF 更 高 层 的 范式 一 一 第 四 范式 (ANF) 和 第 五 范式 (SNF) 
(Fagin，1977，1979 )。 但 是 ， 需 要 用 到 第 四 范式 、 第 五 范式 的 情况 相当 少 。 本 章 ， 我 们 将 
只 讲述 前 三 种 范式 ， 对 BCNF, 4NF AI SNF 的 讨论 则 留 到 下 一 章 进行 。 

规范 化 的 过 程 包括 一 系列 步 又， 每 一 步 都 对 应 着 某 种 具有 已 知性 质 的 特定 范式 。 随 着 规 
范 化 的 进行 ， 关 系 的 个 数 逐 渐 增 多 ， 关 系 的 形式 也 逐渐 受 限 〈 结 构 越 来 越 好 )， 也 就 越 来 越 不 
容易 出 现 更 新 异常 。 对 于 关系 数据 模型 ， 应 该 认识 到 在 建立 关系 时 只 有 满足 第 一 范式 (INF) 
的 需求 是 必需 的 ， 后面 的 其 他 范式 都 是 可 选 的 ， 这 一 点 很 重要 。 但 是 为 了 避免 出 现 14.3 节 讨 
论 的 更 新 异常 ， 通 常 建议 将 规范 化 至 少 进行 到 第 三 范式 (3NF)。 图 14-7 说 明了 各 种 范式 之 间 
的 联系 ， 可 以 看 到 某 些 1NF 的 关系 满足 2NF 的 要 求 ， 某 些 2NF 关系 满足 3NF 的 要 求 ， 等 等 。 





图 14-7 范式 之 间 联 系 的 图 示 


在 后 面 的 小 节 中 我 们 将 详细 讲述 规范 化 的 过 程 。 图 14-8 为 规范 化 过 程 的 纵览 图 ， 图 中 
突出 显示 了 规范 化 过 程 中 每 一 个 步骤 的 主要 操作 ， 并 且 列 出 了 讲述 每 一 步 操作 细节 的 小 节 的 
编号 。 

本 章 ， 我 们 将 规范 化 视 为 一 种 自 下 而 上 的 技术 ， 主 要 讲述 如 何 利用 这 种 技术 从 案例 表单 
中 抽取 属性 信息 ， 并 先 将 其 转化 为 非 范式 (Unnormalized Form, UNF) 表格 的 形式 ， 然 后 将 
其 逐渐 分 解 以 满足 每 一 种 范式 的 要 求 ， 分 解 一 直 进 行 到 原案 例 表 中 的 属性 都 被 分 解 为 在 干 满 
足 3NF 要 求 的 关系 为 止 。 尽 管 本 章 所 使 用 的 例子 是 从 某 一 范式 规范 化 到 更 高 一 级 范式 ， 但 是 ， 
对 于 其 他 的 例子 来 说 并 不 一 定 必须 这 么 做 。 如 图 14-8 所 示 ， 在 解决 某 些 特殊 问题 时 ， 我们 
可 以 将 INF 的 关系 转化 为 2NF 的 关系 ， 或 者 在 某 些 情况 下 ， 直 接 将 其 转化 为 3NF 的 关系 。 

为 了 简化 对 规范 化 的 讲述 ， 我 们 假设 在 所 用 案例 中 ， 每 一 个 关系 都 有 一 个 函数 依赖 集 ， 
每 一 个 关系 都 已 被 指派 了 一 个 主 关键 字 。 也 就 是 说 ， 在 规范 化 的 过 程 开始 之 前 ， 充 分 、 完 全 
地 理解 属性 的 意义 及 其 之 间 的 联系 是 必要 的 。 这 些 信息 是 进行 规范 化 的 基础 ， 我 们 将 利用 
这 些 信 息 来 验证 一 个 关系 是 否 已 经 满足 了 指定 范式 的 要 求 。14.6 节 将 讲述 第 一 范式 (INF). 
14.7 节 和 14.8 节 将 基于 关系 的 主 关键 字 ， 分 别 讲述 2NF 和 3NF， 然 后 在 14.9 节 给 出 2NF 
和 3NF 的 更 一 般 化 的 定义 。2NF 和 INF 的 更 一 般 化 的 定义 考虑 了 关系 中 的 所 有 候选 关键 字 ， 
而 不 仅仅 是 主 关键 字 。 
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把 属性 转换 为 表 的 形式 (14.6 节 描述 ) 





移 除 重复 组 | (14.6 节 描述 ) 


移 除 部 分 依赖 ( 14.7 节 描述 ) 


移 除 传递 依赖 ( 14.8 节 描述 ) 





图 14-8 规范 化 过 程 的 图 示 


14.6 ”第 一 范式 (1NF) 
在 讨论 第 一 范式 之 前 ， 我 们 首先 给 出 在 第 一 范式 之 前 的 状态 的 定义 。 
| 非 范式 (UNF) | 包含 一 个 或 多 个 重复 组 的 表 。 
| 第 一 范式 (1NF) | 属于 第 一 范式 的 关系 ， 其 每 一 行 和 每 一 列 相交 的 位 置 有 且 仅 有 一 个 值 。 


本 章 中 ， 我 们 在 开始 进行 规范 化 之 前 ， 首 先 要 将 数据 从 数据 源 〈 例 如 标准 的 数据 输入 
表单 ) 转换 为 包含 行 和 列 的 表格 形式 。 这 种 格式 的 表 是 非 范 式 的 ， 因 而 被 视 为 非 规范 化 的 表 
( unnormalized table)。 为 了 将 非 规范 化 的 表 转 化 为 第 一 范式 ， 我 们 需要 确定 并 删除 表 中 的 重 
复 组 。 一 个 重复 组 可 以 是 一 个 属性 或 一 组 属性 ， 它 对 应 表 的 某 个 ( 些 ) 关键 属性 的 一 个 实例 
可 能 出 现 多 个 值 。 注 意 ， 这 里 所 说 的 “关键 属性 ”是 指 非 规范 化 的 表 中 那些 可 以 唯一 标识 每 
一 行 的 属性 (组 )。 从 非 规范 化 的 表 中 消除 重复 组 的 党 用 方法 有 两 种 : 
(1) 在 含有 重复 数据 的 那些 行 的 空白 列 上 输入 合适 的 数据 ， 也 就 是 在 需要 填充 的 位 置 复 
制 非 重复 数据 。 这 种 方法 通常 被 看 作 是 对 表 的 平板 化 (flattening) 处 理 。 

(2) 将 重复 数据 单独 移 到 一 个 新 的 关系 中 ， 同 时 也 将 原来 关系 中 的 关键 属性 (组 ) 复制 
到 这 个 新 的 关系 中 。 有 时 候 ， 非 规范 化 的 表 可 能 包含 多 个 重复 组 ， 或 者 在 重复 组 里 
又 有 重复 组 。 在 这 些 情 况 下 ， 重 复 使 用 这 一 方法 直到 不 再 存在 重复 组 为 止 。 知 结果 
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关系 均 不 含 重复 组 ， 则 它们 都 是 1NF 的 。 
这 两 种 方法 得 到 的 结果 关系 都 是 INF 的 关系 ， 在 行 、 列 交叉 处 都 只 包含 原子 (或 单一 ) 
值 。 尽 管 两 种 方法 都 是 正确 的 ， 然 而 方法 1 在 对 原 UNF 的 表 进 行 平板 化 的 过 程 中 也 引入 了 
较 多 的 元 余 ; 方法 2 则 创建 了 两 个 或 更 多 的 关系 ,这些 关 系 的 见 余 度 都 低 于 原 UNF 的 表 的 
元 余 度 。 换 句 话 说 ， 在 对 原 UNF 的 表 的 规范 化 过 程 中 ,方法 2 比方 法 1 做 的 工作 更 多 。 但 
E, 不管 从 哪 一 种 方法 开始 ， 原 UNF 的 表 终 将 被 规范 化 为 一 组 相同 的 3NF 的 关系 。 
下 面 将 就 DreamHome 案例 研究 中 的 一 个 实例 来 分 别 说 明 这 两 种 方法 的 应 用 。 


| 例 14.9 >> 第 一 范式 

图 14-9 是 (简化 的 ) DreamHome 租约 。 最 上 面 的 那 张 是 客户 John Kay 的 租约 ，John 
Kay 租 住 了 格拉 斯 哥 的 一 处 房产 ， 业 主 是 Tina Murphy。 在 这 个 实例 中 ， 我 们 假定 客户 的 每 
一 处 房产 只 能 租 住 一 次 ， 而 且 在 任意 时 刻 都 只 能 租 住 一 处 房产 。 


DreamHome Lease 


DreamHome Lease 
DreamHome Lease 
—— 


Client Number CR76 Property Number FG4 
(Enterifknown) TT T e 

Property Address 

Full Name John Kay 6 Lawrence St, Glasgow 
(Pesenint; Se a ee 


Monthly Rent 350 Owner Number CO40 
(Enter if known) 


Full Name _Tina Murphy 
(Please print) 


Rent Start 01/07/12 


Rent Finish 51/08/15 





图 14-9 (简化 的 ) DreamHome 租约 集 


我 们 取出 两 位 不 同 客户 John Kay 和 Aline Stewart 的 租约 数据 作为 样本 数据 ， 并 将 其 转 
换 为 由 行 、 列 组 成 的 表 的 形式 ， 如 图 14-10 所 示 ， 这 是 一 个 非 规范 化 的 表 。 


ClientRental 


Serni [crara pror [paasee [renra ron omron orere 
CR76 John PG4 6 Lawrence St, | 1-Jul-12 | 31-Aug-13 | 350 | CO40 Tina Murphy 
Kay Glasgow 
PG16 5 Novar Dr, l-Sep-13 | 1-Sep-14 50 | CO93 Tony Shaw 
Glasgow 
CR56 Aline PG4 6 Lawrence St, | 1-Sep-11 | 10-June-12 | 350 | CO40 
Stewart Glasgow 
PG36 2 Manor Rd, | 10-Oct-12 | 1-Dec-13 375 | CO93 
Glasgow 
PG16 5 Novar Dr, 1-Nov-14 | 10-Aug-15 | 450 | CO93 
Glasgow 


图 14-10” 非 规范 化 的 ClientRental 表 




















Tina Murphy 
















Tony Shaw 







Tony Shaw 
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首先 确定 关键 属性 。 非 规范 化 表 ClientRental 的 关键 属性 为 ClientNo。 然 后 确定 重复 
组 。 该 表 的 重复 组 是 房产 出 租 的 信息 ， 在 每 位 客户 的 信息 中 房产 出 租 的 信息 都 重复 出 现 。 该 
重复 组 结构 如 下 : 


Repeating Group = (propertyNo, pAddress, rentStart, rentFinish, rent, ownerNo, oName) 


由 此 可 以 推出 ， 在 某 些 行 、 列 的 交叉 处 会 有 多 个 值 存 在 。 例 如 ， 客 户 John Kay 的 propertyNo 
列 就 有 两 种 取 值 (PG4 和 PG16 )。 为 了 将 非 规范 化 的 表 转 化 为 INF 的 表 ， 我 们 必须 确保 在 
每 一 行 每 一 列 的 交叉 处 都 仅 有 一 个 值 ， 这 可 以 通过 消除 表 中 的 重复 组 (房产 出 租 信息 ) 实现 。 

我 们 可 以 利用 第 一 种 方法 去 除 重 复 组 (房产 出 租 信息 ) : 在 每 一 行 填 上 合适 的 客户 的 数 
据 。 所 得 到 的 结果 关系 ClientRental 是 第 一 范式 的 ， 如 图 14-11 所 示 。 


ClientRental 


Tina Murphy 


5 Novar Dr, 1-Sep-13 -Sep- Tony Shaw 
Glasgow 


6 Lawrence St, | 1-Sep-11 -Jun- Tina Murphy 
Glasgow 


2 Manor Rd, | 10-Oct-12 | 1-Dec- Tony Shaw 
Glasgow 


5 Novar Dr, 1-Nov-14 | 10-Aug-15 Tony Shaw 
Glasgow 


图 14-11 第 一 范式 的 ClientRental 关系 


在 图 14-12 中 ， 列 出 了 关系 ClientRental 的 函数 依赖 《fal ~ fd6 )。 利 用 这 些 函 数 依 
ei (参见 14.4.3 节 ) 可 以 确定 关系 ClientRental 的 候选 关键 字 有 : (clientNo, propertyNo), 
(clientNo，rentStart)， 以 及 (propertyNo，rentStart)。 这 些 候选 关键 字 都 是 合成 关键 字 。 我 
们 选择 (clientNo, propertyNo) 作为 主 关键 字 ， 为 了 容易 区 分 ， 我 们 将 构成 主 关 键 字 的 属性 
在 关系 中 徘 左 放置 。 由 于 属性 rentFinish 可 能 包含 null， 所 以 我 们 假设 属性 rentFinish 不 可 
能 成 为 某 一 个 候选 关键 字 的 成 员 (参见 3.3.1 节 )。 


ClientRental 








fd3 | $ t $ 和 (部 分 依赖 ) 
fd4 | 和 (传递 依赖 ) 
fd5 | t $ | $ t t 和 (候选 关键 字 ) 


fd6 + | t | t ( 候选 关键 字 ) 
图 14-12 关系 ClientRental 的 函数 依赖 
ClientRental 关系 的 定义 如 下 所 示 : 


ClientRental (clientNo, propertyNo, cName, pAddress, rentStart, rentFinish, rent, 
ownerNo, oName) 
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关系 ClientRental 是 INF 的 ， 因 为 在 每 一 行列 的 交叉 处 都 只 有 一 个 值 。 该 关系 包含 了 
描述 客户 、 房 产 出 租 和 业主 的 数据 ， 这 些 数 据 均 有 重复 出 现 ， 因 此 导致 关系 ClientRental 中 
具有 明显 的 数据 了 元 余 。 知 按照 该 设计 物理 实现 的 话 ， 这 个 INF 的 关系 将 会 出 现 14.3 节 摘 述 
的 更 新 异常 。 为 了 消除 更 新 异常 ， 必 须 将 关系 ClientRental 转化 为 2NF 的 ， 这 个 问题 稍 后 
讨论 。 

我 们 也 可 以 利用 第 二 种 方法 ,将 重复 数据 单独 放置 到 一 个 新 的 关系 中 ， 同 时 将 原 关 系 的 
候选 关键 字 (clientNo) 也 复制 到 这 个 关系 中 来 ， 以 此 消除 原 表 中 的 重复 组 (房产 出 租 信息 )， 
如 图 14-13 所 示 。 


Client 





PropertyRentalOwner 


aientNo | properyNo | pAdcress | rent Start | rentFinish | rent | ownerNo | oName | 


6 Lawrence St, Glasgow | 1-Jul-12 -Aug- Tina Murphy 
5 Novar Dr, Glasgow -Sep- -Sep- Tony Shaw 





6 Lawrence St, Glasgow | 1-Sep- -Jun- Tina Murphy 
2 Manor Rd, Glasgow -Oct- -Dec- Tony Shaw 
5 Novar Dr, Glasgow 1-Nov-14 | 10-Aug-15 Tony Shaw 


图 14-13 ”第 一 范式 的 Client 和 PropertyRentalOwner KA 


根据 图 14-12 中 的 函数 依赖 ， 可 以 确定 已 有 关系 的 主 关 键 字 。 上 述 操作 得 到 的 INF 的 
关系 有 : 

Client (clientNo, cName) 

PropertyRentalOwner (clientNo, propertyNo, pAddress, rentStart, rentFinish, rent, 

ownerNo, oName) 

关系 Client 和 PropertyRentalOwner 都 是 INF 的 ， 因 为 在 每 一 行列 的 交叉 处 都 只 有 一 个 
值 。 关 系 Client 包含 了 描述 客户 信息 的 数据 ， 关 系 PropertyRentalOwner 则 包含 了 描述 客户 
租赁 房产 和 业主 信息 的 数据 。 但 是 我 们 从 图 14-13 中 可 以 看 到 ， 关 系 PropertyRentalOwner 
中 仍然 存在 一 定 的 数据 元 余 ， 因 而 仍然 会 出 现 14.3 节 描 述 的 更 新 异常 。 

在 讲解 将 INF 的 关系 规范 化 为 2NF 的 关系 的 过 程 时 ， 我 们 仅 以 图 14-11 中 的 关系 
ClientRental 为 例 。 要 提醒 读者 的 是 ， 这 两 种 方法 都 是 正确 的 ， 而且 对 其 规范 化 后 最 终 得 到 
的 关系 都 是 相同 的 。 我 们 把 对 关系 Client 和 PropertyRentalOwner 进行 规范 化 的 工作 留 给 读 
者 完成 ， 见 本 章 后 面 的 习题 。 « 


14.7 第 二 范式 ( 2NF) 


第 二 范式 基于 完全 函数 依赖 (参见 14.4 节 ) 的 概念 ， 第 二 范式 适用 于 具有 合成 关键 字 的 
关系 ， 即 主 关键 字 由 两 个 或 两 个 以 上 的 属性 构成 。 主 关键 字 仅 包含 一 个 属性 的 关系 已 经 至 少 
是 2NF 的 。 不 是 2NF 的 关系 可 能 会 出 现 14.3 节 讨 论 的 更 新 异常 。 例 如 ， 假 设 我 们 希望 修改 
房产 编号 为 PG4 的 月 租 ， 就 不 得 不 同时 更 新 图 14-11 所 示 关 系 ClientRental 的 两 个 元 组 。 如 
果 仅 更 新 其 中 一 个 元 组 的 月 租 ， 就 会 使 得 数据 库 处 于 一 种 不 一 致 的 状态 。 
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第 二 范式 (ANF) | 满足 第 一 范式 的 要 求 并 且 每 个 非 主 关键 字 属 性 都 完全 函数 依赖 于 主 关键 
字 的 关系 。 
将 INF 关系 规范 化 为 2NF 关系 需要 消除 部 分 依赖 。 如 果 存 在 部 分 依赖 ， 就 要 将 部 分 依 


赖 的 属性 从 原 关系 移出 ， 移 到 一 个 新 的 关系 中 去 ， 同 时 将 这 些 属 性 的 决定 方 也 复制 到 新 的 关 
系 中 。 下 面 将 举例 说 明 如 何 将 INF 的 关系 转化 为 2NF 的 关系 。 


| 例 14.10 » 第 二 范式 
如 图 14-12 所 示 ， 关 系 ClientRental A.A F 7I) R RUK H : 


fdl clientNo, propertyNo — rentStart, rentFinish ( 主 关键 字 ) 
fd2 clientNo 一 cName (部 分 依赖 ) 
fd3 propertyNo 一 pAddress, rent, ownerNo, oName (部 分 依赖 ) 
fd4 ownerNo — oName (传递 依赖 ) 
fd5 clientNo, rentStart 一 propertyNo, pAddress, rentFinish, 

rent, ownerNo, oName ( 候选 关键 字 ) 


fd6 propertyNo, rentStart 一 clientNo, cName, rentFinish (候选 关键 字 ) 


利用 这 些 函 数 依赖 ， 继 续 对 ClientRental 进行 规范 化 。 首 先 通过 确定 主 关键 字 上 是 否 存 
在 部 分 依赖 来 验证 ClientRental 是 否 是 2NF 的 。 通 过 分 析 ， 可 以 发 现 客户 属性 (cName) 部 
分 依赖 于 主 关 键 字 ， 即 cName 仅 依 赖 于 属性 clientNo (fd2 ) ; 房产 的 属性 (pAddress, rent, 
ownerNo，oName) 也 部 分 依赖 于 主 关 键 字 ， 即 仅 依赖 于 属性 propertyNo ( fd3 )。 表 示 房 
产 出 租 的 属性 (rentStart 和 rentFinish) 则 完全 依赖 于 主 关 键 字 ， 即 完全 依赖 于 clientNo 和 
propertyNo (fdl ) 。 

关系 ClientRental 中 存在 的 部 分 函数 依赖 说 明 它 不 是 2NF 的 。 为 了 将 ClientRental X 
系 转化 为 2NF ， 需 要 创建 一 些 新 的 关系 ， 将 那些 存在 部 分 依赖 的 非 主 关键 字 属 性 移 至 其 中 ， 
并 将 它们 完全 函数 依赖 的 那 部 分 主 关键 字 也 复制 到 新 的 关系 中 。 最 终 产 生 了 三 个 新 的 关系 : 
Client, Rental 和 PropertyOwner， 如 图 14-14 所 示 。 在 这 三 个 关系 中 ， 因 为 每 个 非 主 关 键 字 
属性 都 完全 函数 依赖 于 主 关键 字 ， 所 以 它们 都 是 2NF AY: 


Client (clientNo, cName) 

Rental (clientNo, propertyNo, rentStart, rentFinish) 

PropertyOwner (propertyNo, pAddress, rent, ownerNo, oName) 
Client 









CR76 John Kay 
CR56 Aline Stewart 


PropertyOwner 


10-Oct-12 | 1-Dec-13 
l-Nov-14 | 10-Aug-15 








6 Lawrence St, Glasgow | 350 | CO40 Tina Murphy 
5 Novar Dr, Glasgow | 450 | CO93 Tony Shaw 
2 Manor Rd, Glasgow | 375 | CO93 Tony Shaw 


14-14 ”从 关系 ClientRental 导出 的 第 二 范式 的 关系 << 
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14.8 :第 三 范式 已 3MNF 


尽管 2NF 的 关系 比 INF 关系 的 数据 元 余 度 低 ， 但 是 仍然 存在 更 新 异常 问题 。 例 如 ， 当 
我 们 想 要 更 新 一 位 业主 的 姓名 时 ， 比 如 将 ownerNo 为 CO93 的 业主 姓名 更 新 为 Tony Shaw, 
必须 同时 更 新 图 14-11 中 PropertyOwner 关系 中 的 两 个 元 组 。 如 果 只 更 新 了 其 中 的 一 个 元 组 
而 没有 更 新 另 一 个 元 组 ， 那 么 数据 库 就 会 处 于 不 一 致 的 状态 。 此 时 的 更 新 异常 是 由 传递 依赖 
(参见 14.4 节 ) 引起 的 ， 我 们 需要 消除 这 种 依赖 ， 继 续 将 关系 规范 化 到 第 三 范式 。 
第 三 范式 ( 3NF ) | 满足 第 一 范式 和 第 二 范式 的 要 求 并 且 所 有 非 主 关键 字 属 性 都 不 传递 依赖 
于 主 关键 字 的 关系 。 
将 INF 的 关系 规范 化 为 3NF 需要 消除 传递 依赖 。 如 果 存 在 传递 依赖 ， 就 将 传递 依赖 的 
属性 (组 ) 移 到 一 个 新 的 关系 中 ， 并 将 这 些 属性 的 决定 方 也 复制 到 该 关系 中 。 例 14.11 给 出 
了 将 2NF 的 关系 转化 为 3NF 关系 的 过 程 。 


| 例 14.11) 第 三 范式 
从 例 14.10 可 以 推导 出 关系 Client, Rental 和 PropertyOwner 中 存在 如 下 函数 依赖 ， 


Client 

fd2 clientNo 一 cName ( 主 关 键 字 ) 
Rental 

fdl clientNo, propertyNo 一 rentStart, rentFinish ( 主 关 键 字 ) 
fd5' clientNo, rentStart 一 propertyNo, rentFinish (候选 关键 字 ) 
fd6” propertyNo, rentStart 一 clientNo, rentFinish (候选 关键 字 ) 
PropertyOwner 

fd3 propertyNo — pAddress, rent, ownerNo, oName ( 主 关键 字 ) 
fd4 ownerNo 一 oName (传递 依赖 ) 


关系 Client 和 Rental 中 的 所 有 非 主 关 键 字 属性 都 完全 函数 依赖 于 它们 的 主 关 键 字 ， 
Client 和 Rental 也 不 存在 传递 依赖 ， 所 以 它们 已 经 是 3NF。 注 意 : 有 的 函数 依赖 (fd) 的 后 
面 有 一 个 引号 (如 fd5”)， 这 表示 这 个 隐 数 依赖 同 原来 的 函数 依赖 (LE 14-12) 相 比 较 已 经 
发 生 了 变化 。 

关系 PropertyOwner 中 的 所 有 非 主 关键 字 属 性 都 栅 数 依赖 于 它 的 主 关键 字 ，oName 比较 
特殊 ， 它 还 传递 依赖 于 ownerNo (表示 为 fd4 )。 该 传递 依赖 早已 出 现在 图 14-12 中 。 为 了 将 
关系 PropertyOwner 转化 为 3NF， 首 先 必 须 消除 这 个 传递 依赖 ， 我 们 可 以 通过 建立 两 个 新 的 
关系 PropertyForRent 和 Owner 来 消除 该 传递 依赖 ， 如 图 14-15 所 示 。 新 建 的 关系 结构 如 下 : 


PropertyForRent (propertyNo, pAddress, rent, ownerNo) 


Owner (ownerNo, oName) 
因为 在 其 主 关键 字 上 没有 传递 依赖 存在 ， 因 此 关系 PropertyForRent 和 Owner 都 是 3NF 的 。 
PropertyForRent Owner 


Ra [women 


3 6 Lawrence St, Glasgow | 350 | CO40 C040 Tina Murphy 
5 Novar Dr, Glasgow 450 | C093 CO93 Tony Shaw 
2 Manor Rd, Glasgow | 375 | C093 


图 14-15 ”从 关系 PropertyOwner 导出 的 3NF 的 关系 《《 
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图 14-11 所 示 的 关系 ClientRental 经 过 规范 化 后 转换 为 四 个 3NF 的 关系 。 图 14-16 说 明 
了 这 个 规范 化 过 程 ， 通 过 规范 化 ， 我 们 将 最 初 的 INF 关系 分 解 为 了 3NF 的 关系 : 


Client (clientNo, cName) 

Rental (clientNo, propertyNo, rentStart, rentFinish) 

PropertyForRent (propertyNo, pAddress, rent, ownerNo) 

Owner (ownerNo, oName) 

图 14-11 所 示 的 最 初 的 ClientRental 关系 可 以 Cr 1NF 


通过 连接 操作 而 重新 生成 : 将 关系 Client, Rental, 

PropertyForRent 和 Owner 在 主 关 键 字 / 外 部 关键 字 

上 进行 连接 。 例 如 ， 属 性 ownerNo 既是 关系 Owner PropertyOwner 2NF 
的 主 关 键 字 ， 同 时 又 是 关系 PropertyForRent 的 外 
部 关键 字 ， 属 性 ownerNo 的 这 种 特性 使 得 我 们 
能 够 通过 将 关系 PropertyForRent 和 Owner 连接 
起 来 以 确定 业主 的 名 字 。 图 14-16 a laai 

属性 clientNo 既是 关系 Client 的 主 关 键 字 ， j 
又 是 关系 Rental 的 外 部 关键 字 。 注 意 ， 在 这 里 ， 属 性 clientNo 不 仅 是 关系 Rental 的 外 部 关键 
字 ， 而 且 还 是 Rental 主 关 键 字 的 一 部 分 。 类 似 地 ， 属 性 propertyNo 既是 关系 PropertyForRent 
的 主 关 键 字 ， 同 时 又 是 关系 Rental 的 外 部 关键 字 ， 而 且 还 是 Rental 主 关键 字 的 一 部 分 。 

也 就 是 说 ， 规 范 化 过 程 通过 使 用 一 系列 的 关系 代数 投影 (参见 5.1 节 ) 对 原始 关系 
ClientRental 进行 分 解 ， 这 是 一 种 无 损 连接 (lossless-join) (也 称 为 无 损耗 或 无 附加 连接 ) 分 
解 ， 无 损 连 接 分 解 是 可 道 的 ， 即 反 向 使 用 自然 连接 操作 就 可 以 得 到 原 关 系 。 关 系 Client、 
Rental 、PropertyForRent 和 Owner 如 图 14-17 所 示 。 


Client Rental PropertyForRent Owner 3NF 


Client Rental 


CR76 John Kay 
CR56 Aline Stewart 


PropertyForRent 





1-Jul-12 | 31-Aug-13 
1-Sep-13 1-Sep-14 
1-Sep-11 10-Jun-12 
10-Oct-12 | 1-Dec-13 
1-Nov-14 | 10-Aug-15 





6 Lawrence St, Glasgow | 350 | CO40 





5 Novar Dr, Glasgow {450 | CO93 
2 Manor Rd, Glasgow |375 | CO93 


图 14-17 ”从 关系 ClientRental 导出 3NF 关系 小 结 





14.9 2NF 和 3NF 的 一 般 化 定义 

在 14.7 节 和 14.8 FAY 2NF 和 3NF 的 定义 中 ,不 允许 存在 对 主 关键 字 的 部 分 依赖 和 传 
递 依 赖 ， 以 此 避免 出 现 14.3 节 所 述 的 更 新 异常 。 然 而 ， 这 些 定义 并 没有 考虑 关系 中 的 其 他 
候选 关键 字 〈 如 果 存 在 不 止 一 个 候选 关键 字 )。 本 节 将 在 考虑 关系 的 所 有 候选 关键 字 的 基础 
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上 ， 给 出 2NF 和 3NF 的 更 一 般 化 定义 。 注 意 ， 考 虑 关系 的 候选 关键 字 并 不 会 影响 INF 的 定 
义 ， 因 为 1NF 与 关键 字 和 函数 依赖 无 关 。 在 更 一 般 化 的 定义 中 ,我 们 规定 : 属于 任何 一 个 
候选 关键 字 的 属性 都 叫 作 主 属性 ( candidate-key attribute); 提 到 部 分 依赖 、 完 全 依赖 和 传递 
依赖 时 不 仅仅 是 基于 主 关键 字 ， 而 是 基于 所 有 的 候选 关键 字 。 


第 二 范式 ( 2NF) | 满足 第 一 范式 的 要 求 并 且 每 个 非 主 属性 都 完全 函数 依赖 于 任何 一 个 候选 
关键 字 的 关系 。 

第 三 范式 (INF) | 满足 第 一 范式 和 第 二 范式 的 要 求 并 且 没 有 一 个 非 主 属性 传递 依赖 于 任何 
一 个 候选 关键 字 的 关系 。 


在 使 用 2NF 和 3NF 的 一 般 化 定义 时 ， 必 须 注意 是 所 有 候选 关键 字 上 的 部 分 依赖 和 传递 
依赖 ， 而 不 只 是 主 关键 字 上 的 。 这 使 得 规范 化 过 程 变 得 更 加 复杂 ， 但 一 般 化 定义 能 为 关系 增 
加 附加 约束 ， 从 而 有 可 能 发 现 关 系 中 隐藏 的 、 被 遗漏 的 宛 余 。 

在 进行 规范 化 时 ， 是 仅 简 单 地 分 析 主 关键 字 上 的 依赖 ， 还 是 使 用 一 般 化 定义 进行 规范 化 ， 
这 需要 权衡 。 前 者 使 得 规范 化 过 程 简单 ， 并 可 以 发 现 关 系 中 存在 的 大 多 数 问题 和 明显 的 数据 
元 余 ; 后 者 则 有 更 多 的 机 会 发 现 关系 中 被 遗漏 的 元 余 。 实 际 上 ， 和 常见 的 情形 是 ， 无 论 使 用 基于 
主 关 键 字 的 定义 还 是 使 用 2NF、3NF 的 一 般 化 定义 ， 对 关系 进行 分 解 的 结果 相同 。 例 如 ， 如 
果 对 14.7 节 和 14.8 节 中 的 例 14.10 和 例 14.11 规范 化 时 ， 我 们 使 用 的 是 2NF、3NF 的 一 般 
化 定义 ,那么 将 大 关系 分 解 为 小 关系 的 结果 依然 是 相同 的 。 读 者 可 以 自己 来 验证 这 一 事实 。 

下 一 章 将 重新 检查 识别 函数 依赖 的 过 程 ， 这 将 有 助 于 规范 化 的 进行 。 还 将 进一步 讨论 
3NF 以 上 的 范式 ， 如 Boyce-Codd 范式 (BCNF); 我 们 还 将 给 出 第 二 个 基于 DreamHome 案 
例 研 究 的 示例 ， 并 以 此 为 例 展示 将 UNF 规范 化 为 BCNF 的 过 程 。 


本 章 小 结 

e 规范 化 是 一 种 能 够 生成 一 组 既 具 有 所 期 望 的 特性 又 能 满足 企业 数据 需求 的 关系 的 技术 ， 也 是 一 种 依 

靠 关 键 字 和 属性 之 间 的 函数 依赖 对 关系 进行 验证 的 形式 化 技术 。 

存在 数据 元 余 的 关系 可 能 会 产生 更 新 异常 问题 ， 更 新 异常 可 分 为 插入 异常 、 删 除 异 常 和 修改 异常 。 

e 规范 化 的 一 个 重要 的 概念 是 函数 依赖 ， 函 数 依赖 描述 了 属性 之 间 的 联系 。 例 如 ,假设 A 和 B 是 关 
系 R 的 属性 ， 如 果 A 的 每 个 值 都 仅 与 B 中 的 一 个 值 对 应 ， 那 么 B 就 函数 依赖 于 A ( 记 为 A 一 B)。 
(A Ñ B 均 可 能 由 一 个 或 多 个 属性 组 成 。) 

e 阴 数 依赖 的 决定 方 是 指 位 于 箭头 左 端的 属性 或 属性 组 。 

在 规范 化 时 使 用 的 函数 依赖 具有 下 列 特性 : 依赖 左右 两 边 的 属性 (组 ) 之 间 具 有 一 对 一 的 联系 ， 且 

恒 成 立 ， 并 且 右 边 完全 函数 依赖 于 左边 。 

非 范式 (UNF) 是 一 个 包含 了 一 个 或 多 个 重复 组 的 表 。 

e 第 一 范式 (INF) 是 指 每 一 行 和 每 一 列 相 交 的 位 置 有 且 仅 有 一 个 值 的 关系 。 

e 第 二 范式 (2NF) 是 指 已 经 是 第 一 范式 且 每 个 非 主 关键 字 属 性 都 完全 函数 依赖 于 主 关键 字 的 关系 。 

完全 函数 依赖 是 指 若 A、B 是 某 一 关系 的 属性 ， 如 果 B 函数 依赖 于 A， 但 不 函数 依赖 于 A 的 任 一 真 

FRM, WE B 完全 函数 依赖 于 A. 

第 三 范式 (3NF) 是 满足 第 一 范式 和 第 二 范式 的 要 求 并 且 所 有 非 主 关键 字 属 性 都 不 传递 依赖 于 主 关 

键 字 的 关系 。 传 递 依赖 是 指 若 属性 A、B 、C 同属 某 一 关系 ， 如 果 存 在 A 一 B 和 B 一 C, 则 C 通过 

B 传递 依赖 于 A (假设 A 不 函数 依赖 于 B C). 


e 第 二 范式 的 一 般 化 定义 : 满足 第 一 范式 的 要 求 并 且 每 个 非 主 属性 都 完全 函数 依赖 于 任何 一 个 候选 关 
键 字 的 关系 。 其 中 ， 主 属性 是 属于 任 一 候选 关键 字 的 属性 。 

© 第 三 范式 的 一 般 化 定义 : 满足 第 一 范式 和 第 二 范式 的 要 求 并 且 没 有 一 个 非 主 属性 传递 依赖 于 任何 一 
个 候选 关键 字 的 关系 。 其 中 ， 主 属性 是 属于 任 一 候选 关键 字 的 属性 。 


思考 题 


14.1 描述 规范 化 数据 的 目的 。 

14.2 ”讨论 利用 规范 化 支持 数据 库 设 计 的 不 同方 式 。 

14.3 ”描述 具有 数据 元 余 的 关系 可 能 存在 的 各 类 更 新 异常 。 

14.4 描述 函数 依赖 的 概念 。 

14.5 ”描述 通常 用 来 进行 规范 化 的 函数 依赖 的 主要 特性 。 

14.6 ”描述 数据 库 设计 人 员 确 定 某 一 关系 的 函数 依赖 的 典型 方法 。 
14.7 描述 UNF 表 的 特征 以 及 如 何 将 其 转化 为 INF 的 关系 。 

14.8 一 个 关系 必须 满足 的 最 低 范 式 是 什么 ?给 出 该 范式 的 定义 。 
14.9 ”描述 将 UNF 的 表 转 化 为 INF 的 关系 的 两 种 方法 。 

14.10 ”描述 完全 函数 依赖 的 概念 并 说 明 它 与 2NF 的 关联 ， 举 例 说 明 。 
14.11 描述 传递 依赖 的 概念 并 说 明 它 与 3NF 的 联系 ， 举 例 说 明 。 
14.12 ”讨论 基于 主 关 键 字 的 2NF 和 3NF 的 定义 与 其 一 般 化 定义 有 何 区 别 ， 举 例 说 明 。 


a 
14.13 ”继续 将 图 14-13 所 示 的 INF 的 关系 Client 和 PropertyRentalOwner 规范 化 为 3NF 的 关系 。 并 验 
证 这 些 3NF 的 关系 是 否 与 图 14-16 所 示 的 对 INF 的 关系 ClientRental 进行 规范 化 的 结果 相同 。 
14.14 ”分析 Wellmeadows Hospital 的 案例 研究 中 的 病人 治疗 用 药 表 ， 如 图 14-18 所 示 。 
(a) 确定 图 14-18 中 各 列 之 间 的 函数 依赖 。 给 出 所 有 你 对 该 图 数据 和 属性 所 做 的 假设 。 
(b) 描述 并 图 示 说 明 将 图 14-18 中 的 属性 规范 化 为 INF 的 关系 的 过 程 。 
(c) 为 这 些 INF 的 关系 确定 主 关 键 字 、 候 选 关键 宇和 外 部 关键 字 。 


Wellmeadows Hospital 
Patient Medication Form 


Patient Number: P100534 
Full Name: Robert MacDonald Ward Number: Ward 11 












Bed Number: 84 Ward Name: Orthopaedic 


Drug Description | Dosage | Method of | Units per | Start Date | Finish Date 
Number Admin Day 


10223 | Morphine Fain Killer Oral 50 24/03/15. | 24/04/14 
TV he 24/03/13 | 17/04/13 
Fain Killer Oral 10 25/04/14 | O2/05/15 


图 14-18 Wellmeadows Hospital 案例 研究 中 的 病人 治疗 用 药 表 

















Morphine 


14.15 


14.16 


14.17 


图 14-19 的 表 中 是 牙医 /病人 的 预约 看 诊 样本 数据 。 病 人 看 病 前 要 预约 : 预约 好 日 期 和 时 间 以 

及 牙医 和 诊所 。 每 次 到 了 病人 预约 的 那天 ， 牙 医 就 会 在 那 家 诊所 里 为 病人 看 病 。 

(a) 图 14-19 中 的 表 容 易 产 生 更 新 异常 。 给 出 插入 异常 、 删 除 异 和 常 和 修改 异常 的 例子 。 

(b) 确定 图 14-19 的 表 中 各 列 之 间 的 函数 依赖 。 给 出 所 有 你 对 表 中 的 数据 和 属性 所 做 的 
假设 。 

(c) 描述 并 图 示 说 明 将 图 14-19 中 的 表 规 范 化 为 3NF 的 关系 的 过 程 。 并 为 这 些 INF 的 关系 确定 
主 关键 字 、 候 选 关 键 字 和 外 部 关键 字 。 


time 


Tony Smith Gillian White | 12-Sep-13 






































Tony Smith Jill Bell 12-Sep-13 12.00 
Helen Pearson Ian MacKay | 12-Sep-13 10.00 
Helen Pearson Ian MacKay | 14-Sep-13 14.00 
Robin Plevin Jill Bell 14-Sep-13 16.30 
Robin Plevin John Walker | 15-Sep-13 18.00 


图 14-19 医生 /病人 预约 看 诊 样本 数据 表 


有 一 家 被 称 为 Instant Cover 的 公司 为 苏格兰 境内 宾馆 提供 兼职 /临时 雇员 。 图 14-20 的 表 中 给 
出 了 一 些 样本 数据 : 这 家 公司 的 雇员 为 不 同 宾馆 工作 的 时 间 。 对 每 一 位 员工 来 说 ， 其 国家 保险 
编号 (NIN) 都 是 唯一 的 。 


(a) 图 14-20 中 的 表 容 易 受 到 更 新 异常 的 影 pa eine ae ate POPE 


响 。 给 出 插入 异常 、 删 除 异 常 和 修改 异 





East Kilbride 
常 的 例子 。 East Kilbride 
Cb) 确定 图 14-20 的 表 中 各 列 之 间 的 函数 依赖 Glo 
给 出 所 有 你 对 表 中 的 数据 和 属性 所 做 的 -el 
假设 。 图 14-20 Instant Cover 公司 的 样本 数据 表 


(c) 描述 并 图 示 说 明 将 图 14-19 中 的 表 规 范 化 
H INF 的 关系 的 过 程 。 并 为 这 些 INF 的 关系 确定 主 关 键 字 、 候 选 关 键 字 和 外 部 关键 字 。 

有 一 家 名 为 FastCabs 的 公司 为 客户 提供 出 租车 服务 。 图 14-21 中 的 表 显 示 了 客户 预订 出 租车 的 

一 些 信 息 。 假 设 每 位 出 租车 司机 定位 到 一 台 出 租车 ， 而 一 台 出 租车 可 有 一 到 多 位 司机 。 

(a) 确定 图 14-21 的 表 中 各 列 之 间 的 函数 依赖 。 并 指出 该 表 的 主 关键 字 和 可 选 关键 字 (ATE 
的 话 )。 

(b) 说 明 为 什么 图 14-21 中 的 表 不 是 3NF 的 。 

(c) 图 14-21 中 的 表 容 易 受 到 更 新 异常 的 影响 。 给 出 插入 异常 、 删 除 异常 和 修改 异常 的 例子 。 


25/07/14 10.00 Anne Woo 1 Storrie Rd, Paisley 
29/07/14 10.00 Anne Woo 1 Storrie Rd, Paisley 
30/07/14 11.00 i Anne Woo 3 High Street, Paisley 


2/08/14 13.00 i Mark Tin 1A Lady Lane, Paisley 
2/08/14 13.00 Steven Win John Seal 22 Red Road, Paisley 
25/08/14 10.00 Tom Win Karen Bow 17 High Street, Paisley 


图 14-21 FastCabs 公司 的 样本 数据 表 





330 FAB REDBAK 


14.18 A 14-21 的 表 使 用 规范 过 程 ， 得 到 如 图 14-22 所 示 的 三 个 3NF WR. 
(a) 确定 图 14-22 中 每 个 表 的 各 列 之 间 的 函数 依赖 。 并 指出 每 个 表 的 主 关键 字 、 可 选 关 键 字 和 
外 部 关键 字 (和 若 存 在 的 话 )。 
(b) 说 明 为 什么 将 FastCabs 的 数据 存 成 三 个 3NE 的 表 即 可 避免 习题 14.17 (b) 中 描述 的 更 新 
异常 。 
(c) 描述 如 何 通过 图 14-22 中 的 各 表 主 关键 字 和 外 部 关键 字 的 连接 还 原 图 14-21 中 的 表 。 


IS Sane tosh ene 


25/07/14 10.00 
29/07/14 10.00 
30/07/14 11.00 
2/08/14 13.00 
2/08/14 13.00 
25/08/14 10.00 














l Storrier Rd, Paisley 





1 Storrier Rd, Paisley 





3 High Street, Paisley 





1A Lady Lane, Paisley 
22 Red Road, Paisley 
17 High Street, Paisley 






Noe e 
Tom Win 
Jim Jones 
Steven Win 





图 14-22 FastCabs 公司 的 样本 数据 表 (3NE 的 ) 


14.19 学 生 可 租 住 校园 公寓 。 图 14-23 中 的 表 显 示 了 学 生 租 住 校园 公寓 房 的 一 些 信息 。 房 号 〈placeNo) 
唯一 地 确定 公寓 中 每 一 单间 ， 并 在 租房 给 学 生 时 使 用 。 
(a) 确定 图 14-23 的 表 中 各 列 之 间 的 函数 依赖 。 并 指出 该 表 的 主 关键 字 和 可 选 关键 字 (大 存在 
的 话 )。 
(b) 说 明 为 什么 图 14-23 中 的 表 不 是 3NF 的 。 
(c) 图 14-23 中 的 表 容 易 受 到 更 新 异常 的 影响 。 给 出 插 和 人 异常、 删除 异常 和 修改 异常 的 例子 。 


[ ties ee eee ee ee A 


B017706 01/09/2010 30/06/2011 34 High Street, Paisley 
B017706 01/09/2011 30/06/2012 111 Storrie Road, Paisley 


B013399 01/09/2011 30/06/2012 111 Storrie Road, Paisley 
B012124 01/09/2011 30/06/2012 120 Lady Lane, Paisley 
B034511 i 01/09/2012 30/06/2013 111 Storrie Road, Paisley 
B013399 | 01/09/2012 30/06/2013 34 High Street, Paisley 


图 14-23 ”大 学 宿舍 的 样本 数据 表 





14.20 对 图 14-23 的 表 使 用 规范 过 程 ， 得 到 如 图 图 14-24 所 示 的 四 个 3NF 的 表 。 
(a) 确定 图 14-24 中 每 个 表 的 各 列 之 间 的 函数 依赖 。 并 指出 每 个 表 的 主 关键 字 、 可 选 关 键 字 和 
外 部 关键 字 〈 若 存在 的 话 )。 
(b) 说 明 为 什么 将 大 学 宿舍 的 数据 存 成 四 个 3NF 的 表 即 可 避免 习题 14.19 (b) 中 描述 的 更 新 
异常 。 
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(c) 描述 如 何 通过 图 14-24 中 的 各 表 主 关键 字 和 外 部 关键 字 的 连接 还 原 图 14-23 中 的 表 。 


B017706 
B017706 
B013399 
B012124 
B034511 
B013399 


banneriD |fName | IName __ 


01/09/2010 
01/09/2011 
01/09/2011 
01/09/2011 
01/09/2012 
01/09/2012 


30/06/2011 
30/06/2012 
30/06/2012 
30/06/2012 
30/06/2013 
30/06/2013 








F56 34 High Street, Paisley 





F78 





14-24 大 学 宿舍 的 样本 数据 表 (3NF AY) 


111 Storrie Road, Paisley 
120 Lady Lane, Paisle 
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进一步 规范 化 








本 章 我 们 主要 学 习 : 
o 如 何 利用 推导 规则 确定 关系 上 全 部 的 函数 依赖 
o 如 何 利 用 称 为 Armstrong 公理 的 推导 规则 确定 关系 函数 依赖 集 的 最 小 函数 依赖 集 ， 
该 最 小 函数 依赖 集 将 有 助 于 对 关系 进行 规范 化 
3NF 以 上 的 范式 ， 包 括 Boyce-Codd 范式 (BCNF)、 第 四 范式 (4NF) 和 第 五 范式 (5NF) 
如 何 确定 BCNF 
如 何 将 关系 规范 化 为 BCNF 
多 值 依 赖 和 ANF 的 概念 
违反 了 4NF 规则 的 关系 会 产生 的 问题 
如 何 将 违反 ANF 规则 的 关系 规范 化 为 ANF 的 关系 
连接 相关 性 和 5NF 的 概念 
违反 了 SNF 规则 的 关系 会 产生 的 问题 
如 何 将 违反 SNF 规则 的 关系 规范 化 为 5NF 的 关系 


前 面 一 章 ， 我 们 介绍 了 规范 化 的 技术 以 及 属性 之 间 函 数 依赖 的 概念 ， 还 讲述 了 利用 规 
范 化 技术 支持 数据 库 设计 的 好 处 ， 以 及 如 何 将 样本 表格 中 的 属性 规范 化 为 第 一 范式 (INF). 
第 二 范式 (2NF)， 最 终 规范 化 为 第 三 范式 (SNF), SS, RR, 我 们 还 要 考虑 函数 依赖 并 
且 讨 论 3NF 以 上 的 范式 ， 例 如 Boyce-Codd 范式 (BCNF)、 第 四 范式 (4NF) 和 第 五 范式 
(SNF)。3NF 关系 的 结构 良好 ,通常 足以 防止 产生 与 数据 元 余 相 关 的 问题 (参见 14.3 节 )。 
然而 ， 规 范 到 更 高 级 的 范式 还 能 发 现 关 系 中 一 些 较 少 见 的 问题 ， 若 不 纠正 这 些 问题 ， 仍 然 会 
导致 不 期 望 的 数据 元 余 。 


除了 INF， 上 一 章 以 及 本 章 提 到 的 所 有 范式 都 是 基于 关系 的 属性 之 间 的 函数 依赖 的 。 
15.1 节 我 们 继续 讨论 上 一 章 中 讲述 的 函数 依赖 。 通 过 对 函数 依赖 推理 规则 的 讨论 ， 展 示 出 函 
数 依 赖 更 加 形式 化 和 理论 化 的 一 面 。 

上 一 章 我 们 讲述 了 三 种 最 常用 的 范式 : INF, 2NF 和 3NF。 但 是 ，R. Boyce f' E. F. 
Codd 发 现 了 3NF 的 弱点 ， 提 出 了 一 种 增强 的 3NF 的 定义 ， 即 BCNF (Codd, 1974), 15.2 
节 将 讲述 这 部 分 内 容 。15.3 节 将 给 出 一 个 用 过 的 研究 实例 ， 以 说 明 将 原 报 告 中 的 属性 规范 化 
为 一 组 BCNF 关系 的 过 程 。 

比 BCNF 更 高 层 的 范式 将 在 其 后 讲述 ， 比 如 4NF f SNF (Fagin，1977，1979 )。 但 是 ， 
这 些 范式 在 实际 当中 很 少 使 用 。4NF 和 SNF 分 别 在 15.4 节 和 15.5 节 讲 述 。 

在 描述 规范 化 过 程 中 用 到 的 实例 取 自 DreamHome 案例 研究 ， 该 案例 研究 在 11.4 节 引 
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入 ,详细 描述 参见 附件 A。 


15.1 ”函数 依赖 的 进一步 讨论 

与 规范 化 密切 相关 的 概念 之 一 就 是 函数 依赖 ， 函 数 依赖 定义 了 属性 之 间 的 联系 ( Maier， 
1983 )。 上 一 章 已 经 讲述 了 这 一 概念 ， 本 章 将 通过 对 函数 依赖 推导 规则 的 讨论 ， 以 更 加 形式 
化 和 理论 化 的 方式 继续 讲述 函数 依赖 。 


15.1.1 ” 通 数 依赖 的 推导 规则 


14.4 节 已 经 定义 了 规范 化 时 最 常用 到 的 函数 依赖 的 特性 。 然 而 ， 即 使 我 们 仅仅 关注 那些 
左边 和 右边 具有 一 对 一 ( 1 : 1 ) 的 联系 、 恒 成 立 且 右边 完全 函数 依赖 于 左边 的 函数 依赖 ， 对 
于 给 定 的 关系 来 说 ， 由 所 有 满足 上 述 要 求 的 函数 依赖 构成 的 集合 依然 非常 庞大 ， 因 此 我 们 要 
找到 一 种 方法 ， 利 用 这 种 方法 将 该 集合 减 小 到 一 个 易于 处 理 的 规模 ， 这 一 点 很 重要 。 理 论 
上 ， 我 们 想 要 确定 一 个 关系 的 函数 依赖 集 (用 X 表示 )，X 要 小 于 由 该 关系 上 成 立 的 全 部 郴 
数 依赖 构成 的 集合 (用 Y KR), HH Y 中 的 每 一 个 函数 依赖 都 能 够 被 X 蕴涵 。 因 此 ， 如 果 
我 们 支持 了 X 中 的 函数 依赖 所 定义 的 完整 性 约束 ， 上 自然 也 就 实现 了 立 中 的 函数 依赖 所 定义 
的 完整 性 约束 。 这 种 需求 表明 必须 可 以 从 一 些 函 数 依赖 推导 出 男 外 一 些 函 数 依赖 。 例 如 ， 如 
果 关 系 中 存在 函数 依赖 A 一 B 和 B 一 C， 则 函数 依赖 A 一 C 在 该 关系 中 也 成 立 。A 一 C 就 
是 一 个 传递 函数 依赖 的 例子 ， 在 前 面 的 14.4 节 和 14.7 节 我 们 已 经 讨论 过 了 。 

我 们 怎样 开始 着 手 确定 关系 中 这 些 有 用 的 函数 依赖 呢 ? 通常 ， 数 据 库 设计 人 员 首 先 确定 
那些 语义 上 非常 明显 的 函数 依赖 ; 但 是 ， 经 常 还 会 有 大 量 的 其 他 函数 依赖 的 存在 。 事 实 上 ， 
在 实际 的 数据 库 项 目 中 要 想 确定 所 有 可 能 的 函数 依赖 基本 上 是 不 现实 的 。 然 而 ， 在 本 节 里 ， 
我 们 的 确 是 在 讨论 一 种 帮助 我 们 确定 关系 的 所 有 隆 数 依赖 集合 的 方法 ， 然 后 讨论 如 何 获 得 一 
个 能 够 表示 这 个 所 有 集 的 最 小 函数 依赖 集 。 

被 某 一 函数 依赖 集 X 所 蕴涵 的 所 有 函数 依赖 的 集合 称 为 X 的 闭 包 ， 记 为 X EA, R 
们 需要 一 组 规则 帮助 我 们 从 X 计算 出 X'。 被 称 为 Armstrong 公理 的 这 套 推导 规则 ， 规 定 了 
如 何 从 已 知 的 函数 依赖 推导 出 新 的 依赖 ( Armstrong，1974 )。 为 了 便于 讨论 ,我们 用 A、B 
和 C 表示 关系 R 的 属性 的 子 集 。Armstrong 公理 如 下 : 

(1) 自 反 性 (Reflexivity): @BHAMTR, W A> B, 

(2) 增 广 性 (Augmentation): # A—>B, 则 A, C—>B, Co 

(3) 传递 性 (Transitivity): 车 A 一 B 且 B 一 C, 则 A 一 C。 

上 述 三 条 规则 都 可 以 利用 函数 依赖 的 概念 直接 证 明 。 给 定 一 个 函数 依赖 的 集合 和 X 后， 
利用 这 三 条 规则 就 可 以 推导 出 所 有 XX 所 蕴涵 的 函数 依赖 ， 因 此 Armstrong 的 规则 是 完备 的 。 
规则 又 是 有 效 的 ， 因 为 所 有 不 被 XX 所 蕴涵 的 函数 依赖 都 不 会 被 推导 出 来 。 也 就 是 说 ， 可 以 
利用 Armstrong 的 三 条 规则 导出 六 的 闭 包 XX 。 

从 上 述 三 条 规则 还 可 以 推导 出 其 他 几 条 规则 ， 利 用 这 些 规则 可 以 简化 X 的 计算 。 在 以 
下 规则 中 ，D 也 表示 关系 R 的 属性 的 一 个 子 集 : 

(4) 自 确定 性 (Self-determination): A— A. 

(5) 分 解 性 (Decompositon): @A—B, C, 则 A 一 B, A 一 C。 

(6) 合并 性 (Union): 若 A 一 B 且 A 一 C, 则 A 一 B，C。 

(7) 复合 性 (Composition): # A—>B, C>D, 则 A，C 一 B，D。 


334 HARRY REED RIT 


规则 1 ( 自 反 性 规则 ) 和 规则 4 ( 自 确 定性 规则 ) 表明 一 组 属性 总 能 决定 它 的 任意 子 集 和 
它 自身 。 因 为 用 这 两 个 规则 导出 的 函数 依赖 总 是 成 立 的 ， 所 以 这 些 依赖 是 平庸 的 ( trivial), 
如 前 所 述 ， 是 我 们 不 感 兴趣 的 、 对 规范 化 没 用 的 函数 依赖 。 规 则 2( 增 广 性 规则 ) 表明 在 依 
赖 的 左右 两 边 同 时 增加 一 组 相同 的 属性 后 得 到 的 依赖 仍然 是 有 效 的 依赖 。 规 则 3 (传递 性 规 
则 ) 表明 函数 依赖 是 可 以 传递 的 。 规 则 5 (分 解 性 规则 ) 表明 去 掉 依 赖 右边 的 一 些 属性 后 ， 
依赖 仍然 成 立 。 重 复 使 用 这 个 规则 ， 就 可 以 将 函数 依赖 A 一 B，C, D 分 解 为 一 组 函数 依赖 
A 一 B、A 一 C 和 A 一 D。 而 规则 6 (合并 性 规则 ) 表明 反之 亦 然 ， 即 我 们 可 以 将 函数 依赖 
A 一 B、A 一 C 和 A 一 D 合 并 为 一 个 函数 依赖 A 一 B，C，D。 规 则 7 (复合 性 规则 ) 比 规 
则 6 更 加 一 般 化 ， 它 表明 可 以 将 一 组 不 相 重 堆 的 困 数 依赖 合并 成 一 个 新 的 依赖 。 

在 开始 确定 一 个 关系 的 函数 依赖 集合 F 时 ， 通 常 我 们 会 首先 根据 属性 的 语义 确定 部 分 函 
数 依赖 。 然 后 ， 应 用 Armstrong 公理 (规则 1 ~ 3 ) 推导 出 其 他 的 函数 依赖 。 推 导 这 些 函 数 . 
依赖 的 一 种 系统 化 的 方法 是 首先 确定 所 有 会 在 依赖 的 左边 出 现 的 属性 组 A， 然 后 确定 所 有 依 
赖 于 A 的 属性 。 这 样 ， 对 于 每 一 组 属性 A， 我 们 都 可 以 确定 一 个 属性 集 A, A 是 基于 下 被 
A 函数 决定 的 属性 的 集合 (A 被 称 为 A 在 F 下 的 闭 包 (closure))。 


15.1.2 最 小 函数 依赖 集 


本 节 将 介绍 函数 依赖 的 等 价 集合 。 如 果 函 数 依赖 集 YY 的 每 一 个 函数 依赖 都 属于 函数 依 
HEX KAE X, MEY RX Be, MY 中 的 每 个 依赖 都 能 够 从 XX 导出。 如 果 函 数 依 赖 
E X 满足 下 列 条 件 ， 就 称 X 是 最 小 函数 依赖 集 : 

e X 中 每 个 依赖 的 右边 都 只 包含 单个 属性 。 

e 对 XX 中 任意 依赖 A 一 B， 不 存在 A 的 一 个 真子 集 C， 使 得 用 依赖 C B 替换 依赖 

A 一 B 后 得 到 的 防 数 依赖 集 仍旧 和 X 等 价 。 

e 从 X 中 去 掉 任 何 依赖 以 后 的 函数 依赖 集 与 X 都 不 等 价 。 

最 小 依赖 集 应 该 是 一 种 没有 宛 余 的 标准 形式 。 函 数 依 赖 集 X 的 最 小 覆盖 是 与 X 等 价 的 
最 小 依赖 集 Xman。 不 幸 的 是 ， 一 个 函数 依赖 集 可 能 有 几 个 最 小 覆盖 。 下 面 就 举例 说 明 如 何 确 
EKA StaffBranch 上 的 最 小 覆盖 。 


| 例 15.1 >> 确定 关系 StaffBranch 的 最 小 函数 依赖 集 
Xt Fi] 14.5 中 的 关系 StaffBranch 的 函数 依赖 集 应 用 最 小 函数 依赖 集 的 三 个 条 件 ， 我 们 得 
到 了 下 面 的 函数 依赖 : 


staffNo 一 sName 

staffNo 一 position 

staffNo — salary 

staffNo — branchNo 
branchNo 一 bAddress 
bAddress 一 branchNo 
branchNo, position — salary 
bAddress, position — salary 


这 些 函 数 依赖 能 够 满足 上 述 三 个 条 件 ， 因 此 就 是 关系 StaffBranch 的 最 小 函数 依赖 集 。 
条 件 1 保证 了 每 个 依赖 都 是 标准 的 ， 即 右边 只 有 单个 属性 。 条 件 2 和 条 件 3 保证 了 这 些 依赖 
中 没有 宛 余 ， 其 中 包括 : 依赖 的 左边 不 包含 元 余 属性 (条件 2 ) ; 不 存在 能 由 X 中 其 他 函数 
依赖 导出 的 函数 依赖 (条件 3 )。 « 
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下 面 我 们 将 重新 考虑 规范 化 的 问题 。 首 先 讨论 一 种 比 3NF 更 高 的 范式 一 一 Boyce-Codd 
范式 (BCNF), 


15.2 Boyce-Codd 范式 (BCNF) 


上 一 章 ， 我 们 分 别 举 例 说 明了 2NF Al 3NF 如 何 消除 对 主 关键 字 的 部 分 依赖 和 传递 依赖 。 
若 关 系 上 具有 对 主 关 键 字 的 部 分 依赖 和 传递 依赖 则 会 产生 14.3 节 讨 论 过 的 更 新 异常 。 然 而 ， 
14.7 节 和 14.8 节 的 2NF 和 3NF 的 定义 中 并 没有 考虑 对 其 他 候选 关键 字 的 部 分 依赖 和 传递 依 
赖 的 存在 。14.9 节 提 出 了 2NF 和 3NF 的 一 般 化 定义 ， 即 不 允许 存在 任何 对 候选 关键 字 的 部 
分 依赖 和 传递 依赖 。 应 用 2NF 和 3NF 的 一 般 化 定义 可 以 发 现 ， 由 于 对 候选 关键 字 存 在 部 分 
和 传递 依赖 而 产生 的 元 余 。 然 而 ， 即 使 增加 了 这 些 附加 约束 ， 在 3NF 的 关系 中 仍 有 可 能 存 
在 一 些 会 引起 匈 余 的 依赖 。3NF 的 这 一 不 足 导致 了 男 外 一 种 更 强 的 范式 的 出 现 一 一 Boyce- 
Codd 范式 (Codd，1974 )。 


Boyce-Codd 范式 的 定义 


Boyce-Codd 范式 是 在 考虑 了 关系 中 所 有 候选 关键 字 上 的 图 数 依赖 的 基础 上 定义 的 。 尽 
管 如 此 ， 同 14.9 节 的 3NF 的 一 般 化 定义 相 比 较 ，BCNF 还 添加 了 一 些 其 他 的 约束 。 


Boyce-Codd 范式 | 当 且 仅 当 每 个 函数 依赖 的 决定 方 都 是 候选 关键 字 时 ， 某 一 关系 才 是 
BCNF 的 。 


为 了 验证 一 个 关系 是 否 是 BCNF W, 我们 首先 要 确定 所 有 的 决定 方 ， 然 后 再 验证 它们 
是 否 都 是 候选 关键 字 。 回 想 一 下 决定 方 的 定义 :; 决定 方 就 是 一 个 或 一 组 被 其 他 属性 完全 函数 
依赖 的 属性 。 

3NF 和 BCNF 之 间 的 区 别 表 现在 对 于 一 个 函数 依赖 A 一 B，3NF 允许 B 是 主 关 键 字 属 
HEH A 不 是 候选 关键 字 ; 但 是 ，BCNF 却 要 求 在 这 个 依赖 中 ，A 必须 是 候选 关键 字 。 所 以 ， 
Boyce-Codd 范式 是 增强 的 3NF， 每 一 个 BCNF 的 关系 也 是 3NF 的 ， 但 是 一 个 3NF 的 关系 
却 不 一 定 是 BCNF 的 。 

在 分 析 下 一 个 例子 之 前 ， 我们 重新 考虑 一 下 图 14-17 中 的 关系 Client, Rental, Property- 
ForRent 和 Owner。 其 中 ，Client、PropertyForRent 和 Owner 都 已 经 是 BCNF 范式 ， 因 为 这 些 
关系 都 只 有 一 个 决定 方 ， 并 且 决 定 方 都 是 候选 关键 字 。 再 回 过 头 来 看 看 关系 Rental, CHGS 
三 个 决定 方 : (clientNo, propertyNo), (clientNo, rentStart) 和 (propertyNo，rentStart)， 在 关 
系 Rental 上 成 立 的 函数 依赖 如 下 所 示 (参见 例 14.11 ): 

fdl clientNo, propertyNo 一 rentStart, rentFinish 

fd5’ clientNo, rentStart 一 propertyNo, rentFinish 

fd6’ propertyNo, rentStart 一 clientNo, rentFinish 

由 于 关系 Rental 的 这 三 个 决定 方 都 是 候选 关键 字 ， 所 以 Rental 也 是 BCNF 范式 。 一 般 
很 少 会 违反 BCNF, ， 除 了 在 一 些 比较 特殊 的 条 件 下 。 可 能 会 违反 BCNF 的 情况 有 : 

e 关系 中 包含 两 个 (或 更 多 个 ) 合成 候选 关键 字 。 

o 候选 关键 字 互 相 重 炙 ,通常 至 少 都 包含 一 个 相同 的 属性 。 

在 接 下 来 的 示例 中 ， 我 们 将 给 出 一 种 违反 BCNF 范式 的 情况 ， 并 说 明 如 何 将 这 个 关系 
转化 为 BCNF 范式 。 这 个 示例 给 出 了 将 INF 关系 转化 为 BCNF 关系 的 过 程 。 
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| 例 15.2 >} Boyce-Codd 范式 (BCNF) 

本 例 将 对 DreamHome 案例 研究 进行 扩 ” Clientinterview 
展 ， 加 入 了 DreamHome 的 员工 与 客户 进行 clientNo | interviewDate | interviewTime | staffNo | roomNo 
会 谈 的 记录 。 与 会 谈 相 关 的 信息 都 记录 在 关 
系 ClientInterview 中 ， 如 图 15-1 所 示 。 在 
会 谈 那 天 ， 参 与 会 谈 的 员工 被 安排 在 一 个 指 
定 的 房间 。 但 是 ， 根 据 需 要 ， 在 一 个 工作 日 
里 一 个 房间 可 能 会 被 分 配给 多 个 员工 。 一 个 图 15-1 关系 ClientInterview 
客户 仅 在 指定 的 日 期 参与 一 次 会 谈 ， 但 有 可 能 会 在 以 后 的 日 子 进 行 其 他 的 会 谈 。 

关系 ClientInterview 有 三 个 候选 关键 字 : (clientNo, interviewDate), (staffNo, interview- 
Date, interviewTime) 和 ( roomNo，interviewDate，interviewTime)， 所 以 关系 ClientInterview 
有 三 个 合成 候选 关键 字 ， 它 们 都 包含 了 一 个 共同 的 属性 interviewDate。 我 们 选择 (clientNo， 
interviewDate) 作为 主 关键 字 。 关 系 ClientInterview 的 结构 如 下 所 示 : 


Clientinterview (clientNo, interviewDate. interviewTime, staffNo, roomNo) 
KA ClientInterview E IRM AY eA Fras : 





fdl clientNo, interviewDate — interviewTime, staffNo, roomNo (XRF) 

fd2 staffNo, interviewDate, interviewTime 一 clientNo ( 候选 关键 字 ) 

fd3 roomNo, interviewDate, interviewTime 一 staffNo, clientNo ( 候选 关键 字 ) 

fd4 staffNo, interviewDate — roomNo < 


现在 我 们 分 析 一 下 这 些 函 数 依 赖 以 确定 关系 ClientInterview 的 范式 。 由 于 函数 依赖 fdl. 
fd2 、fd3 都 是 该 关系 的 候选 关键 字 ， 所 以 这 些 依 赖 都 不 会 给 ClientInterview 市 来 任何 问题 。 
唯一 需要 讨论 的 函数 依赖 是 ( staffNo，interviewDate) 一 roomNo (fd4 )。 尽 管 ( staffNo， 
interviewDate) 不 是 关系 ClientInterview 的 候选 关键 字 ， 但 是 由 于 roomNo 是 候选 关键 字 
(roomNo, interviewDate, interviewTime) 的 一 部 分 ， 因 此 roomNo 是 主 属 性 ， 所 以 这 个 
函数 依赖 也 是 3NF 所 人 允许 的 。 因 为 在 主 关键 字 ( clientNo，interviewDate) 上 不 存在 部 分 
依赖 和 传递 依赖 ， 并 且 孔 数 依 赖 fd4 也 没有 破坏 SNF 的 条 件 ， 所 以 关系 ClientInterview 是 
3NF 的 。 

但 是 ， 这 个 关系 却 不 是 BCNF 的 (一 种 增强 的 3NF 范式 )。 因 为 决定 方 ( staffNo，inter- 
viewDate) 不 是 关系 的 候选 关键 字 ， 而 BCNF 要 interview 
求 关系 中 所 有 的 决定 方 都 必须 是 候选 关键 字 ， 所 clientNo | interviewDate | interviewTime | staffNo 
以 关系 ClientInterview 可 能 会 出 现 更 新 异常 。 例 ee edie 
如 ， 当 我 们 要 改变 员工 SG5 在 2005 年 5 月 13 
日 进行 会 谈 的 房间 编号 时 ， 就 需要 同时 对 两 个 
元 组 进行 更 新 。 如 果 只 更 新 了 一 个 元 组 的 房间 编 
号 ， 就 会 导致 数据 库 的 状态 不 一 致 。 

为 了 将 关系 ClientInterview 转化 为 BCNF 
范式 ， 就 必须 消除 不 满足 BCNF 条 件 的 函数 依 
赖 ， 为 此 ， 可 以 建立 两 个 新 的 关系 Interview 和 13-May-14 |G102 
StaffRoom， 如 图 15-2 所 示 。 这 两 个 关系 的 结构 ”此 ska A 
如 下 所 示 : 图 15-2 BCNF 的 关系 Interview 和 StaffRoom 
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Interview (clientNo, interviewDate, interviewTime, staffNo) 

StaffRoom (staffNo, interviewDate, roomNo) 

如 上 所 示 ， 我 们 可 以 将 任何 不 是 BCNF 的 关系 分 解 成 BCNF 的 关系 。 但 是 ， 这 种 分 
解 的 结果 并 非 总 是 我 们 想 要 的 BCNF 关系 ， 比 如 说 ， 如 果 在 分 解 过 程 中 丢失 了 某 个 函数 依 
赖 〈 也 就 是 说 ， 决 定 方 和 由 它 决 定 的 属性 被 分 解 到 了 不 同 的 关系 中 )， 其 结果 就 并 非 我 们 所 
求 。 在 这 种 情况 下 ， 也 就 很 难 实现 该 函数 依赖 ， 一 个 重要 的 约束 也 会 因此 而 丢失 。 当 发 生 这 
种 情况 时 ， 最 好 将 规范 化 过 程 只 进行 到 3NF， 而 只 将 关系 分 解 到 SNF 是 不 会 丢失 任何 依赖 
的 。 注 意 ， 在 例 15.2 中 ， 当 我 们 将 关系 ClientInterview 分 解 成 两 个 BCNF 的 关系 时 ， 就 已 
经 “丢失 ”了 函数 依赖 : roomNo, interviewDate, interviewTime — staffNo, clientNo (fd3 ). 
因为 这 个 依赖 的 决定 方 被 分 解 到 了 不 同 的 关系 中 。 但 是 ， 还 必须 认识 到 ， 如 有 果 不 消除 函数 依 
$f staffNo, interviewDate 一 roomNo (fd4 )， 那 么 关系 ClientInterview 中 将 会 存在 数据 元 余 。 

在 规范 化 关系 ClientInterview 时 ， 是 规范 化 到 INF 好 还 是 继续 规范 化 到 BCNF ， 主 要 
考虑 是 由 fd4 导致 的 数据 元 余 度 产生 的 影响 大 还 是 由 于 “丢失 ”fd3 造成 的 影响 更 大 。 例 
如 ， 如 果 每 个 员工 每 天 只 与 客户 进行 一 次 会 谈 ， 在 这 种 情况 下 ， 关 系 ClientInterview E H PK 
数 依赖 fd4 的 存在 不 会 导致 数据 元 余 ， 因 此 也 就 没有 必要 将 关系 ClientInterview 分 解 成 两 个 
BCNF 的 关系 ， 即 使 分 解 ， 也 没有 什么 额外 的 用 处 。 相 反 ， 如 果 每 位 员工 每 天 都 会 多 次 与 客 
户 进行 会 谈 ， 那 么 函数 依赖 fd4 的 存在 势必 产生 数据 元 余 ， 所 以 这 时 就 要 将 ClientInterview 
规范 化 为 BCNF 范式 。 然 而 ， 我 们 还 应 该 考虑 丢失 fd3 的 影响 ， 即 fd3 是 否 传达 了 关于 客户 
会 谈 的 一 些 重要 信息 ， 而 且 这 些 信息 必须 在 结果 关系 中 表现 出 来 ? 对 这 个 问题 的 回答 可 以 帮 
助 我 们 决定 到 底 是 保留 所 有 的 函数 依赖 还 是 消除 数据 元 余 。 


15.3 ”规范 化 到 BCNF 的 过 程 小 结 


本 节 将 对 前 面 章节 以 及 15.2 节 讲 述 的 规范 化 过 程 加 以 小 结 。 我 们 以 来 目 DreamHome 
案例 研究 的 样本 报表 为 例 ， 说 明 如 何 将 其 属性 规范 化 为 一 组 Boyce-Codd 范式 。 在 这 个 例子 
中 ， 我 们 使 用 的 是 基于 主 关 键 字 的 2NF 和 3NF 的 定义 ， 如 何 使 用 2NF 和 3NF 的 一 般 化 定 
义 对 该 例 进行 规范 化 则 留 给 读者 作为 练习 。 


| 例 15.3 办 从 第 一 范式 规范 化 到 Boyce-Codd 范式 

在 这 个 实例 中 ， 我 们 对 DreamHome 案例 研究 进行 扩展 ， 加 入 了 员工 对 房产 进行 调查 的 
信息 。 要 求 员 工 进行 房产 调查 时 ， 会 分 配 一 辆 公司 专车 供 其 调查 当天 使 用 。 但 是 ， 在 一 个 工 
作 日 里 ， 一 辆 车 可 能 会 根据 需要 被 分 配给 多 名 员工 使 用 。 一 名 员工 也 可 能 在 一 天 对 多 处 房产 
进行 调查 ， 但 一 处 房产 在 一 天 只 会 被 调查 一 次 。DreamHome 的 房产 调查 报告 如 图 15-3 所 示 。 
最 上 面 的 一 份 报告 是 员工 对 位 于 格拉 斯 哥 的 房产 PG4 的 调查 报告 。 
第 一 范式 

首先 将 两 份 房产 调查 报告 中 的 样本 数据 转化 为 含有 行 、 列 的 表 的 形式 ， 得 到 的 表 
StaffPropertyInspection 是 一 个 不 规范 的 表 ， 如 图 15-4 所 示 ， 这 个 不 规范 的 表 的 关键 字 属 性 
是 propertyNo。 

可 以 发 现 这 张 不 规范 的 表 的 重复 组 是 房产 调查 信息 和 员工 信息 ， 这 些 信息 在 每 一 处 房产 
的 调查 信息 记录 中 都 会 重复 一 次 。 该 重复 组 的 结构 如 下 : 


Repeating Group = (iDate, iTime, comments, staffNo, sName, carReg) 
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6 Lawrence St, | 18-Oct-12 | 10.00 | Need to replace crockery Ann Beech | M231 JGR 
Glasgow 22-Apr-13 | 09.00 | In good order David Ford | M533 HDR 
1-Oct-13 | 12.00 | Damp rot in bathroom SG14 David Ford | N721 HFR 
5 Novar Dr, | 22-Apr-13 | 13.00 | Replace living room carpet | SG14 David Ford | M533 HDR 
Glasgow 24-Oct-13 | 14.00 | Good condition SG37 “| Ann Beech | N721 HFR 


图 15-4” 非 规范 化 表 StaffPropertyInspection 


由 此 可 以 推出 ， 该 表 的 某 些 行列 交叉 处 都 出 现 了 多 种 取 值 。 例 如 ， 对 于 属性 propertyNo 
为 PG4 的 房产 来 说 ， 其 属性 iDate 列 就 有 三 种 取 值 ( 18-Oct-12，22-Apr-13，1-Oct-13 )。 我 
们 用 14.6 节 的 第 一 种 方法 将 这 个 不 规范 的 表 转 化 为 第 一 范式 。 利 用 第 一 种 方法 ， 通 过 在 表 


的 每 一 行 中 插入 合适 的 房产 信息 ( 非 重 复数 据 ) 来 消除 重复 组 (房产 调查 信息 和 员工 信息 )。 
最 后 得 到 的 第 一 范式 StaffPropertyInspection 关系 如 图 15-5 所 示 。 







A -g - 


18-Oct-12 | 10. Need to replace crockery 


22-Apr-13 j In good order 
Glasgow 

1-Oct-13 í Damp rot in bathroom 

22-Apr-13 | 13. Replace living room 


carpet 
Good condition 





图 15-5 第 一 范式 (INF) StaffPropertyInspection 关系 
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在 图 1$-6 中 ， 我 们 给 出 了 关系 StaffPropertyInspection 的 函数 依赖 (fdl 一 fda6 )。 用 
ie HE pr HK (A 14.4.3 节 ) 可 以 确定 关系 StaffPropertyInspection 的 三 个 复合 候选 关键 
字 : (propertyNo, iDate), (staffNo, iDate, iTime) 和 (carReg，iDate，iTime)。 我 们 选择 
(propertyNo, iDate) 作为 主 关 键 字 。 为 了 清楚 起 见 ， 将 构成 主 关键 字 的 属性 挨 在 一 起 ， 放 
在 关系 的 左 侧 ， 则 关系 StaffPropertyInspection 的 结构 如 下 所 示 : 


StaffPropertyinspection (propertyNo, iDate, iTime, pAddress, comments, staffNo, sName, 
carReg) 


illic i hic 





fd1 | | = — = , as r = 主 关键 字 ) 
d2 | 个 (部 分 依赖 ) 
d3| 个 (传递 依赖 ) 
fd4 | | A 
rash | | 4 4 4 4 | (候选 关键 字 ) 
fd6 个 | | A A | (候选 关键 字 ) 


图 15-6 关系 StaffPropertyInspection 上 的 函数 依赖 


由 于 每 一 行列 的 交叉 部 分 都 只 有 一 个 值 ， 所 以 关系 StaffPropertyInspection 是 第 一 范式 
(INF) 的 。 该 关系 包含 了 员工 对 房产 进行 调查 的 信息 ， 其 中 房产 和 员工 的 信息 都 出 现 了 多 次 
重复 。 可 以 看 出 ， 在 StaffPropertyInspection 中 存在 着 大 量 的 数据 了 元 余 ， 如 果 物 理 实现 的 话 ， 
这 个 INF 的 关系 将 会 产生 更 新 异常 。 为 了 消除 部 分 更 新 异常 ， 必 须 将 这 个 关系 进一步 转化 
为 第 二 范式 。 

第 二 范式 

将 第 一 范式 的 关系 规范 化 为 2NF 的 关系 需要 消除 主 关键 字 上 的 部 分 依赖 。 如 果 存 在 部 
分 依赖 ， 就 要 把 关系 中 部 分 函数 依赖 于 主 关键 字 的 属性 移 到 一 个 新 的 关系 中 ， 同 时 将 其 决定 
方 也 复制 到 新 的 关系 中 。 

如 图 15-6 所 示 ， 关 系 StaffPropertyInspection 上 的 函数 依赖 (fdl ~ fd6 ) A: 


{dl propertyNo, iDate 一 iTime, comments, staffNo, 


sName, carReg ( 主 关 键 字 ) 
fd2 propertyNo + pAddress ( 部 分 依赖 ) 
fd3 staffNo 一 sName (传递 依赖 ) 


fd4 staffNo, iDate 一 carReg 
fd5 carReg, iDate, iTime 一 propertyNo, pAddress, 
comments, staffNo, sName ( REX RF ) 

fd6 staffNo, iDate, iTime — propertyNo, pAddress, comments ( 候选 关键 字 ) 

All FA ie E phi BK RA, FR AT] AK BE MT SE AK StaffPropertyInspection 进行 规范 化 。 首 先 通过 
测试 主 关 键 字 上 是 否 存 在 部 分 依赖 来 验证 StaffPropertylInspection 是 否 是 2NF 的 。 可 以 发 
现房 产 的 属性 (pAddress) 是 部 分 依赖 于 主 关键 字 的 ， 即 pAddress 是 依赖 于 propertyNo 的 
( fd2 )， 而 其 余 的 属性 (iTime, comments, staffNo, sName 和 carReg) 则 是 完全 依赖 于 整 
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个 主 关键 字 (propertyNo 和 iDate) 的 (fdl )s 尽管 函数 依赖 staffNo, iDate 一 carReg ( fd4 ) 
的 决定 方 只 含有 主 关键 字 的 iDate 属性 ， 但 在 这 个 阶段 并 不 准备 消除 这 一 依赖 ， 因 为 这 个 决 
定 方 还 含有 一 个 非 主 关键 字 的 属性 stafftNo。 也 就 是 说 ， 这 个 依赖 并 不 是 全 部 依赖 于 主 关键 
字 的 一 部 分 ， 所 以 与 2NF 的 定义 并 不 矛盾 。 

部 分 依赖 ( propertyNo —> pAddress) 的 存在 说 明了 关系 StaffPropertyInspection 不 是 
2NF 的 。 为 了 将 这 个 关系 转化 为 2NF， 需 要 创建 一 些 新 的 关系 ， 使 得 那些 在 原 关 系 中 部 分 依 
赖 于 主 关 键 字 的 属性 在 新 的 关系 里 完全 依赖 于 新 关系 的 主 关 键 字 。 

通过 消除 关系 中 的 部 分 依赖 ， 将 关系 StaffPropertyInspection 转化 为 了 第 二 范式 ， 生 成 
了 两 个 新 的 关系 Property 和 PropertyInspection， 其 结构 如 下 : 


Property (propertyNo, pAddress) 
Propertyinspection (propertyNo, iDate, iTime, comments, staffNo, sName, carReg) 


由 于 这 两 个 关系 的 每 一 个 非 主 关 键 字 属性 都 函数 依赖 于 它们 的 主 关 键 字 ， 所 以 这 两 个 关 
系 都 是 2NF 的 。 
第 三 范式 

将 2NF 的 关系 规范 化 为 3NF 的 关系 需要 消除 传递 依赖 。 如 果 存 在 传递 依赖 ， 就 将 产生 
传递 依赖 的 属性 移 到 一 个 新 的 关系 中 ， 并 将 这 些 属性 的 决定 方 也 复制 过 去 。 关 系 Property 和 
PropertyInspection 上 的 浮 数 依赖 有 : 
关系 Property 

fd2 propertyNo — pAddress 


关系 PropertyInspection 


fdl propertyNo, iDate — iTime, comments, staffNo, sName, carReg 
fd3 staffNo — sName 

fd4 staffNo, iDate 一 carReg 

fd5’ carReg, iDate, iTime 一 propertyNo, comments, staffNo, sName 
fd6’ staffNo, iDate, Time 一 propertyNo, comments 


由 于 关系 Property 中 没有 主 关键 字 上 的 传递 依赖 ， 所 以 它 已 经 是 3NF 的 。 尽 管 关 
系 PropertyInspection 的 所 有 非 主 关键 字 属 性 都 完全 依赖 于 该 关系 的 主 关 键 字 ,但 是 属性 
sName 却 传 递 依赖 于 staffNo (fd3 )。 我 们 还 注意 到 函数 依赖 stafftNo，iDate 一 carReg (fd4 ) 
中 有 一 个 非 主 关键 字 属 性 carReg 部 分 依赖 于 男 一 个 非 主 关键 字 属 性 staffNo。 但 在 这 一 阶 
段 并 不 移 除 这 个 依赖 ， 因 为 在 这 个 依赖 的 决定 方 中 包含 了 一 个 主 关 键 字 属性 iDate。 即 这 个 
依赖 并 不 完全 是 非 主 关 键 字 属性 的 传递 依赖 ， 所 以 并 不 违反 3NF 的 定义 。( 也 就 是 说 ， 正 
如 14.9 节 讨 论 的 那样 ， 当 考虑 关系 的 所 有 候选 关键 字 时 ， 依 赖 staffNo，iDate 一 carReg 在 
3NF 中 是 允许 的 ， 因 为 carReg 是 关系 PropertyInspection 的 候选 关键 字 (carReg, iDate, 
iTime) 的 一 部 分 ， 故 为 主 属性 。) 

为 了 将 PropertyInspection 转化 为 3NF， 必 须 消除 传递 依赖 ( staffNo 一 sName)， 由 此 创 
建 两 个 新 的 关系 Staff 和 PropertyInspect， 其 结构 如 下 : 


Staff (staffNo, sName) 
Propertyinspect (propertyNo, iDate, iTime, comments, staffNo, carReg) 


由 于 在 关系 Staff 和 PropertyInspect 中 不 存在 非 主 关键 字 属 性 完全 函数 依赖 于 另 一 个 非 
主 关键 字 属 性 ， 所 以 Staff Al PropertyInspect 都 是 3NF 的 。 通 过 规范 化 ， 图 15-5 中 的 关系 
StaffPropertyInspection 就 被 转化 为 了 三 个 3NF 的 关系 ， 如 下 所 示 : 
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Property (propertyNo, pAddress) 
Staff (staffNo, sName) 


Propertyinspect (propertyNo, iDate, iTime, comments, staffNo, carReg) 


Boyce-Codd 范式 

现在 来 分 析 关 系 Property, Staff 和 PropertyInspect， 看 看 它们 是 否 是 BCNF 的 。 回 忆 一 
下 BCNF 的 定义 ， 只 有 当 所 有 的 决定 方 都 是 候选 关键 字 时 ， 这 个 关系 才 是 BCNF 的 。 所 以 ， 
为 了 验证 这 些 关 系 是 否 是 BCNF 的 ， 可 以 先 确定 所 有 的 决定 方 ， 再 验证 它们 是 否 都 是 候选 
关键 字 。 

关系 Property. Staff 和 PropertyInspect 上 成 立 的 函数 依赖 有 : 
关系 Property 

fd2 propertyNo — pAddress 


关系 Staff 
fd3 staffNo 一 sName 


关系 PropertyInspect 


fdl’ propertyNo, iDate 一 iTime, comments, staffNo, carReg 
fd4 staffNo, iDate 一 carReg 

fd5’ carReg, iDate, iTime 一 propertyNo, comments, staffNo 
fd6” staffNo, iDate, iTime 一 propertyNo, comments 


可 以 看 到 ， 由 于 关系 Property 和 Staff 的 每 个 决定 方 都 是 候选 关键 字 ， 所 以 这 两 个 关系 
已 经 是 BCNF 的 。 现 在 只 有 3NF 的 关系 PropertyInspect 不 是 BCNF 的 ， 这 是 因为 决定 方 
(staffNo，iDate)(fd4 ) 不 是 候选 关键 字 。 由 此 可 以 推断 ， 关 系 PropertyInspect 可 能 会 存在 更 
新 异常 的 问题 。 例 如 ， 当 2012 年 4 月 22 日 (22-Apr-12) 那天 派 给 员工 SG14 的 车 的 信息 
发 生变 化 时 ， 必 须 同 时 更 新 两 个 元 组 。 如 果 只 有 一 个 元 组 更 新 了 车 辆 登记 编号 ， 就 会 导致 数 
据 库 处 于 不 一 致 的 状态 。 

为 了 将 关系 PropertyInspect 转化 为 BCNF 的 关系 ， 必 须 消除 那些 违反 了 BCNF 定义 的 
依赖 ， 因 此 可 以 创建 两 个 新 的 关系 StaffCar 和 Inspection， 其 结构 如 下 : 

StaffCar (staffNo, iDate, carReg) 

Inspection (propertyNo, iDate, iTime, comments, staffNo) 

由 于 关系 StaffCar 和 Inspection 的 决定 方 都 是 候选 关键 字 ， 所 以 这 两 个 关系 都 是 BCNF 的 。 

现在 我 们 来 小 结 一 下 ， 将 图 15-5 中 的 关系 StaffPropertyInspection 分 解 为 图 15-7 所 示 的 
BCNF 的 关系 。 在 这 个 示例 当中 ， 





StaffPropertyinspection 1NF 
将 原 关 系 StaffPropertyInspection 分 
解 为 BCNF 的 关系 导致 了 函数 依赖 
carReg, iDate, iTime 一 propertyNo, Propertyinspection 2NF 


pAddress, comments, staffNo, 

sName 的 “丢失 ”， 因 为 该 依赖 的 决 

定 方 现在 位 于 不 同 的 关系 中 (fd5 )。 Propertylnspect 3NF 
然而 我 们 也 认识 到 ， 如 果 不 消 除 函 数 j 

”依赖 staffNo, iDate 一 carReg (fd4 ), 

那 从 = Z Pr opertyInspect 中 将 会 存 Staff StaffCar Inspection Property BCNF 
TERE TCA 图 15-7 ”将 关系 StaffPropertyInspection 分 解 为 BCNF 的 关系 
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最 后 得 到 的 BCNF 关系 的 如 下 所 示 : 


Property (propertyNo, pAddress) 

Staff (staffNo, sName) 

Inspection (propertyNo, iDate, iTime, comments, staffNo) 
StaffCar (staffNo, iDate, carReg) 


利用 主 关键 字 /外 部 关键 字 机 制 ， 可 以 由 关系 Property、Staff、StaffCar 和 Inspection 
重新 得 到 最 初 的 图 15-5 所 示 的 关系 StaffPropertyInspection。 例 如 ， 属 性 staffNo 是 关系 
Staff 的 主 关 键 字 ， 同 时 也 是 关系 Inspection 的 外 部 关键 字 。 外 部 关键 字 人 允许 将 关系 Staff 和 
Inspection 关联 起 来 以 确定 对 某 一 房产 进行 调查 的 员工 姓名 。 « 


15.4 ”第 四 范式 (4NF) 


尽管 BCNF 消除 了 由 于 函数 依赖 所 带 来 的 异常 ， 但 是 进一步 的 研究 表明 ， 另 外 一 种 依 
H 多 值 依赖 ( Multi-Valued Dependency，MVD)， 也 会 导致 数据 元 余 (Fagin, 1977). 
KH, 我们 将 简要 地 讲述 多 值 依赖 以 及 这 种 依赖 和 第 四 范式 ( 4NF) 之 间 的 关联 。 


15.4.1 多 值 依赖 


由 于 第 一 范式 不 允许 元 组 任 一 属性 的 取 值 是 值 的 集合 ， 因 此 关系 中 就 可 能 会 存在 多 值 
依赖 。 例 如 ， 如 果菜 一 关系 有 两 个 多 值 属性 ， 为 了 保证 关系 中 元 组 的 一 致 性 ， 则 其 中 一 个 属 
性 的 每 一 种 取 值 都 不 得 不 重复 男 一 个 属性 的 所 有 值 。 这 种 类 型 的 约束 就 是 多 值 依 赖 ( Multi- 
Value Dependency，MVD)， 多 值 依 赖 导致 了 数据 元 余 。 考 虑 图 15-8a 所 示 的 关系 BranchStaff- 
Owner， 该 关系 中 包含 了 每 个 分 公司 (branchNo) 的 员工 (sName) 和 业主 (oName)。 在 这 个 例 
子 中 ， 假 设 每 个 员工 的 名 字 (sName) 和 每 个 业主 的 名 字 (oName) 都 是 唯一 的 。 


BranchStaffOwner BranchStaff BranchOwner 


Ann Beech | Carol Farrel B003 Carol Farrel 
David Ford | Carol Farrel 
David Ford 


a) 关系 BranchStaffOwner b) 第 四 范式 的 BranchStaff 和 BranchOwner 关 系 
图 15-8 














Tina Murphy 


在 本 例 中 ， 员 工 Ann Beech 和 David Ford 在 分 公司 B003 工作 ， 业 主 Carol Farrel 和 
Tina Murphy 均 是 在 分 公司 B003 注册 的 。 然 而 ， 由 于 在 某 分 公司 工作 的 员工 与 在 某 分 公司 
注册 的 业主 之 间 没 有 直接 的 联系 ， 因 此 需要 创建 将 每 个 员工 和 业主 关联 在 一 起 的 元 组 以 保证 
关系 的 一 致 性 。 关 系 BranchStaffOwner 中 的 这 种 约束 就 是 多 值 依 赖 ， 即 MVD 的 存在 是 由 于 
关系 BranchStaffOwner 中 包含 了 两 个 独立 的 一 对 多 关系 。 


多 值 依赖 | 表示 关系 中 属性 (如 A、B 和 C) 之 间 的 依赖 ， 对 于 A 的 每 一 种 取 值 ，B 和 C 都 
分 别 有 一 个 值 集合 与 之 对 应 ， 并 且 B、C 的 取 值 是 相互 独立 的 。 
BA, BAIC 之 间 的 MVD 用 如 下 的 标记 表示 : 


A —> B 
A —> C 
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例如 ， 图 15-8a 中 的 关系 BranchStaffOwner 上 的 MVD 有 : 


branchNo 一 之 sName 
branchNo 一 之 oName 


多 值 依 赖 又 可 以 进一步 分 为 平凡 的 ( trivial) MIELH (nontrivial), FXR R PHS 
Eki A->B, WR (a) B 是 A 的 子 集 ， 或 者 (b) A U B= 二 R， 那么 多 值 依赖 A -> B 就 是 
平凡 的 ， 否 则 A> B 就 是 非 平凡 的 。 平 凡 MVD 并 不 对 应 着 关系 中 的 任何 约束 ， 而 一 个 非 平 
Ju MVD 则 代表 了 关系 上 的 一 个 约束 。 

图 15-8a 中 的 关系 BranchStaffOwner 包含 两 个 非 平 凡 MVD， 即 branchNo - SName 和 
branchNo -> oName， 而 branchNo 不 是 该 关系 的 候选 关键 字 。 因 此 ， 关 系 BranchStaff- 
Owner 受 这 些 非 平 凡 MVD WAR: 为 了 保证 属性 sSName 和 oName 之 间 关 系 的 一 致 性 ， 元 
组 信息 不 得 不 重复 。 人 例如， 如果 要 为 分 公司 B003 新 增 一 位 业主 ， 为 了 保证 关系 的 一 致 性 就 
必须 插 人 两 个 新 的 元 组 ， 每 个 元 组 对 应 着 一 名 员工 。 这 是 一 个 由 非 平凡 MYVD 的 存在 而 引起 
更 新 异常 的 例子 。 很 明显 ， 我 们 需要 一 种 范式 以 排除 像 关 系 BranchStaffOwner 这 样 的 关系 
结构 。 


15.4.2 ”第 四 范式 的 定义 


第 四 范式 ( 4NF) | 一 个 关系 是 4NF 当 且 仅 当 对 每 一 个 非 平 凡 多 值 依赖 A -> B，A 都 是 关 
系 的 候选 关键 字 。 


第 四 范式 能 够 防止 关系 中 存在 那些 决定 方 不 是 关系 候选 关键 字 的 非 平凡 MVD (Fagin, 
1977.)。 违 反 4NF 规则 会 引起 的 数据 元 余 ， 正 如 前 面 图 15-8a 所 示 。 规 范 非 4NF 的 关系 需要 
消除 关系 中 那些 引发 问题 的 多 值 依赖 ， 这 可 以 通过 将 产生 多 值 依赖 的 属性 及 其 决定 方 的 副本 
移 到 一 个 新 的 关系 中 来 实现 。 

例如 ， 图 15-8a 中 的 关系 BranchStaffOwner 由 于 存在 两 个 非 平 凡 MVD， 所 以 不 是 4NF 
的 。 我 们 将 关系 BranchStaffOwner 分 解 为 两 个 关系 BranchStaff 和 BranchOwner， 如 图 15-8b 
所 示 。 这 两 个 新 关系 都 是 4NF 的 ， 因 为 在 关系 BranchSta 任 中 只 存在 平凡 MVD: branchNo > 
sName， 而 在 关系 BranchOwner 中 也 只 存在 平凡 MVD : branchNo -> oName, JER: 由 于 
ANF 中 没有 数据 匈 余 ， 所 以 也 就 消除 了 潜在 的 更 新 异常 。 例 如 ， 如 果 为 分 公司 B003 新 增 一 名 
业主 ， 那 么 只 需 在 关系 BranchOwner 中 增加 一 个 元 组 。 关 于 ANF 更 详细 的 讨论 ， 感 兴趣 的 读 
者 请 参见 Date (2012 ) 及 Elmasri 和 Navathe ( 2010 ) 。 


15.5 REA ( SNF) 


无 论 何 时 将 一 个 关系 分 解 为 两 个 关系 ， 结 果 关 系 总 是 要 具有 无 损 连 接 的 特性 。 无 损 连 接 
特性 是 指 将 分 解 后 的 结果 关系 重新 连接 起 来 就 能 生成 原 关 系 。 尽 管 比较 少见 ， 但 有 的 时 候 需 
要 将 一 个 关系 分 解 为 多 个 关系 ， 这 时 就 可 以 用 连接 依赖 和 第 五 范式 来 处 理 。 下 面 将 简要 地 讲 
述 无 损 连 接 依赖 及 其 与 第 五 范式 的 关联 。 


15.5.1 无 损 连接 依赖 


无 损 连 接 依赖 | 一 种 与 分 解 有 关 的 特性 ， 该 特性 能 够 确保 在 通过 自然 连接 运算 将 分 解 后 的 
关系 重新 组 合 起 来 时 ， 不 会 产生 廖 误 的 元 组 。 
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在 使 用 投影 运算 拆 分 关系 时 ， 这 种 分 解 方法 可 以 很 清楚 地 体现 出 无 损 连 接 依赖 的 特性 。 
具体 来 说 ， 就 是 我 们 在 使 用 投影 运算 进行 分 解 时 要 非常 小 心 谨慎 ， 要 使 得 过 程 可 逆 ， 即 还 可 
以 通过 连接 投影 的 结果 关系 而 重 构 原 关系 。 由 于 这 样 的 分 解 保 留 了 原 关系 中 的 所 有 数据 ， 并 
且 没 有 产生 附加 的 雇 误 元 组 ， 所 以 这 样 的 分 解 就 称 为 无 损 连接 (也 称 为 无 损耗 或 无 附加 连接 ) 
分 解 。 例如， 图 15-8a 和 图 15-8b 显示 了 将 关系 BranchStaffOwner 分 解 为 关系 BranchStaff 
和 BranchOwner， 该 分 解 就 具有 无 损 连接 的 特性 。 也 就 是 说 ， 可 以 通过 对 关系 BranchStaff 
和 BranchOwner 进行 目 然 连接 运算 来 重 构 最 初 的 BranchStaffOwner 关系 。 在 这 个 例子 中 ， 
原 关 系 被 分 解 为 两 个 关系 。 但 是 ， 有 的 时 候 却 需要 将 一 个 关系 无 损 连接 地 分 解 为 两 个 以 上 的 
RAR (Aho et al.，1979 )， 这 些 情 况 就 是 无 损 连接 依赖 和 第 五 范式 (SNF) 所 要 关注 的 。 


15.5.2 第 五 范式 的 定义 


第 五 范式 (5NF) | 一 个 关系 是 5NF 当 且 仅 当 对 于 关系 R 的 每 个 连接 依赖 (Ri，R2，… 
Rn)， 每 个 投影 包含 原 关系 的 一 个 候选 关键 字 。 


第 五 范式 (SNF) 能 防止 关系 中 存在 那些 所 关联 投影 不 包含 原 关 系 的 任 一 候选 关键 字 的 
JEF JLE kK i (Fagin，1977 )。 不 与 候选 关键 字 相 关联 的 非 平凡 连接 依赖 十 分 少见 ， 因 此 
通常 4NF 都 是 5NF 的 。 
尽管 少见 ， 还 是 让 我 们 看 看 若 关 系 违 反 SNF 的 规则 会 出 现 什 么 问题 。 图 15-9a 所 示 关 系 
PropertyItemSupplier 包括 了 一 个 非 平凡 连接 依赖 。 该 关系 描述 房产 (propertyNo) 需要 的 家 
具 (itemDescription) 及 其 供给 该 房产 的 供应 商 ( supplierNo) 的 信息 。 而 且 约 定 ， 当 某 处 房 
产 (p) 需要 某 家 具 (i) IM, AAEM (s) BEZZA (i)， 并 且 该 供应 商 (s) 又 已 经 为 该 
房产 (p) 供应 过 至 少 一 件 家 具 ， 那 么 该 供应 商 (s) 就 将 继续 为 房产 (p) 供应 家 具 (i)。 在 
该 例 中 ,假设 对 家 具 的 描述 属性 (itemDescription) 能 够 唯一 标识 每 种 类 型 的 家 具 。 
为 了 确定 图 15-9a 的 关系 PropertyItemSupplier 的 约束 类 型 ， 考 虑 下 面 的 情形 : 


如 果 房产 PG4 需要 Bed (K) (元 组 1) 
供应 商 S2 为 房产 PG4 供应 过 家 具 (元 组 2) 
供应 商 S2 A Bed 出 售 (FC Al 3 ) 


那么 就 由 供应 商 S2 为 房产 PG4 供应 Bed 

这 个 例子 说 明了 关系 PropertyltemSupplier 上 约束 的 循环 特性 (cyclical nature)。 如 果 在 
设计 上 支持 该 约束 ， 那 么 就 说 明 无 论 在 何 种 合法 的 状态 下 ， 关 系 PropertyltemSupplier 中 都 
必然 存在 元 组 (PG4，Bed，S2 )， 如 图 15-9b 所 示 。 这 是 一 类 更 新 异常 的 示例 ， 我 们 说 在 这 
个 关系 中 存在 连接 依赖 (Join Dependency, JD). 


连接 依赖 | 连接 依赖 是 依赖 的 一 种 。 对 于 关系 及 及 其 属性 的 子 集 A，B，…，Z， 当 且 仅 当 
R 的 每 一 个 合法 的 元 组 都 与 其 在 A，B，…，Z 上 的 投影 的 连接 结果 相同 时 ， 称 关系 及 满足 
连接 依赖 。 

由 于 关系 PropertyItemSupplier 中 含有 连接 依赖 ， 所 以 它 不 是 5NF 的 。 为 了 消除 连接 
依赖 ， 我 们 将 关系 PropertyltemSupplier 分 解 为 三 个 SNF 的 关系 ， 即 Propertyltem (R1), 
ItemSupplier ( R2 ) 和 PropertySupplier ( R3 )， 如 图 15-10 所 示 。 也 就 是 说 形 为 (A, B, C) 
的 关系 PropertyItemSupplier 满足 连接 依赖 JD (R1 (A, B), R2 (B, C), R3 (A, C))。 
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a) 关系 PropertyItemSupplier 的 不 合法 状态 





当 这 个 元 组 被 
添加 到 关系 中 时 








b) 关系 PropertyItemSupplier 的 合法 状态 
ea ae 


图 15-10 SNF 的 关系 PropertyItem ItemSupplier 和 PropertySupplier 


对 这 三 个 关系 中 的 任意 两 个 进行 目 然 连接 运算 都 会 产生 廖 误 的 元 组 ， 这 一 点 很 重要 ， 我 
们 要 注意 。 但 是 如 果 自 然 连接 这 三 个 关系 ， 就 可 以 重 构 原 关系 PropertyItemSupplier。 

关于 第 五 范式 更 详细 的 讨论 ， 感 兴趣 的 读者 可 以 参见 Date (2012) 和 Elmasri and 
Navathe ( 2010 )。 


本 章 小 结 

o 可 以 利用 推导 规则 来 导出 在 某 一 关系 上 成 立 的 所 有 函数 依赖 。 一 个 关系 上 的 函数 依赖 集 可 能 很 大 。 

e 称 为 Armstrong 公理 的 推导 规则 可 以 根据 某 一 关系 上 成 立 的 函数 依赖 确定 其 最 小 函数 依赖 集 。 

e Boyce-Codd 范式 (BCNF) 是 每 一 个 决定 方 都 是 候选 关键 字 的 关系 。 

e 一 个 关系 是 4NF 当 且 仅 当 对 每 一 个 非 平 凡 多 值 依赖 A -> B，A 都 是 关系 的 候选 关键 字 。 

e 多 值 依赖 (MVD) 表示 关系 中 属性 (A，B 和 C) 之 间 的 依赖 ， 即 对 于 A 的 每 个 值 ， 都 对 应 着 B 的 
一 个 取 值 集合 和 C 的 一 个 取 值 集合 ， 而 且 ，B 和 C 的 值 集 是 相互 独立 的 。 

e 无 损 连 接 依赖 是 一 种 分 解 的 特性 ， 它 表示 当 关 系 通过 自然 连接 运算 重新 组 合 起 来 时 ， 不 会 产生 廖 误 
的 元 组 。 

e 一 个 关系 是 SNF 当 且 仅 当 对 于 关系 R 的 每 个 连接 依赖 (Ri，R2，…，Rn)， 每 个 投影 包含 原 关 系 的 
一 个 候选 关键 字 。 


思考 题 


15.1 描述 利用 推导 规则 确定 给 定 关 系 的 函数 依赖 的 目的 。 
15.2 ”讨论 Armstrong 公理 的 用 途 。 
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15.3. 讨论 Boyce-Codd 范式 (BCNF) 的 作用 和 BCNEF 与 3NF 的 区 别 。 请 举例 说 明 。 


15.4 
15.5 


习题 


15.6 


15.7 


15.8 


15.9 


15.10 


描述 多 值 依 赖 的 概念 并 讨论 多 值 依赖 与 4NF 的 关系 。 请 举例 说 明 。 
描述 连接 依赖 的 概念 并 讨论 连接 依赖 与 SNF 的 关系 。 请 举例 说 明 


继续 完成 练习 14.14， 分 析 表 示 图 14-18 的 Wellmeadows Hospital 表格 信息 的 3NF 的 关系 。 判 断 
这 些 INF 的 关系 是 否 也 是 BCNF 的 ， 若 不 是 ， 将 其 转化 为 BCNF。 
继续 完成 练习 14.15， 分 析 表 示 图 14-19 的 牙医 /病人 预约 数据 的 3NF 的 关系 。 判 断 这 些 3NF 
的 关系 是 否 也 是 BCNF 的 ， 若 不 是 ， 将 其 转化 为 BCNF。 
继续 完成 练习 14.16， 分 析 表 示 图 14-20 的 Instant Cover 公司 雇员 合约 数据 的 3NF 关系 。 判 断 
这 些 3NF 的 关系 是 否 也 是 BCNF 的 ， 若 不 是 ， 将 其 转化 为 BCNF。 
15-11 的 表 列 出 了 在 不 同 病 房 (wardName) 工作 的 员工 (staffName) 和 分 配 到 各 个 病房 的 病 
人 (patientName)。 在 病房 工作 的 员工 和 分 配 到 该 病房 的 病人 之 间 没 有 任何 关联 。 本 例 中 ， 假 
设 员工 的 名 字 (staffName) 唯一 地 标识 每 位 员工 ， 病 人 的 名 字 (patientName) 唯一 地 标识 每 位 
病人 。 
(a) 说 明 为 什么 图 15-11 的 关系 不 是 4NF 的 。 
(b) 图 15-11 的 关系 容易 受到 更 新 异常 的 影响 ,请 给 出 插入 异常 、 删 除 异常 和 修改 异常 的 例子 。 
(c) 描述 并 解释 说 明 将 图 15-11 的 关系 规范 化 为 4NF 的 过 程 。 
图 15-12 中 的 关系 描述 了 医院 (hospitalName) 需要 的 设备 ( itemDescription) 的 信息 ， 这 些 设 
备 由 相应 的 供应 商 (supplierNo) 提供 给 医院 ( hospitalName)。 而 且 ， 当 医院 (h) 需要 某 种 设 
(i) 时 ， FEMRA (s) 供应 设备 (i) 且 已 经 为 医院 (h) 提供 过 至 少 一 种 设备 ， 则 供应 商 (s) 
将 继续 为 医院 Ch) 提供 设备 (i)。 在 这 个 例子 中 假设 对 设备 的 描述 (itemDescription) 唯一 地 标 
识 每 一 种 类 型 的 设备 。 
(a) 说 明 为 什么 图 15-12 的 关系 不 是 5NF 的 。 
(b) 描述 并 解释 说 明 将 图 15-12 的 关系 规范 化 为 5NF 的 过 程 。 


Western General | Antiseptic Wipes | S1 


Western General | Paper Towels 
Antiseptic Wipes | S2 
Western General | Antiseptic Wipes 





图 15-11 关系 WardStaffPatient 图 15-12 关系 HospitalltemSupplier 
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本 章 我 们 主要 学 习 : 

© 设计 方法 学 的 用 途 

数据 库 设 计 的 三 个 主要 阶段 概念 设计 、 逻 辑 设计 和 物理 设计 

如 何 将 整体 设计 分 解 为 企 事业 单位 的 具体 视图 

如 何 根 据 企 事业 单位 视图 所 给 出 的 信息 ， 用 实体 一 联系 ( ER) 模型 建立 局 部 概念 数 
据 模 型 

如 何 验 证 全 局 概念 模型 的 有 效 性 ， 确 保 其 能 真实 准确 地 反映 企 事业 单位 的 视图 

© 如 何 将 概念 数据 库 的 设计 过 程 用 文档 记录 下 来 

o 终端 用 户 在 整个 概念 数据 库 设计 过 程 中 的 重要 作用 


第 10 章 我 们 讨论 了 数据 库 系 统 开 发 的 生命 周期 ， 其 中 一 个 主要 的 阶段 就 是 数据 库 设 计 。 
数据 库 设计 阶段 在 企 事业 单位 的 需求 分 析 完 全 结束 之 后 才 开始 。 

本 章 以 及 后 面 的 第 17 ~ 19 章 ， 都 将 针对 适用 于 关系 数据 库 系 统 开发 生命 周期 中 数据 库 
设计 阶段 的 方法 学 进行 讨论 。 这 些 方法 学 分 步 给 出 了 三 个 主要 数据 库 设 计 阶 段 的 指南 ， 分 别 
是 概念 设计 、 逻 辑 设 计 和 物理 设计 (参见 图 10-1 )。 每 个 阶段 的 主要 目标 如 下 : 

© 概念 数据 库 设 计 : 生成 数据 库 的 概念 表示 ， 包 括 重 要 的 实体 、 联 系 以 及 属性 的 定义 。 

e 逻辑 数据 库 设计 : 将 概念 表示 转换 成 数据 库 的 逻辑 结构 ， 包 括 关系 的 设计 。 

e 物理 数据 库 设 计 : 如 何在 目标 数据 库 管理 系统 (DBMS) 中 物理 地 实现 逻辑 结构 ( 作 

为 基础 关系 )。 





16.1 节 给 出 了 数据 库 设 计 方 法 学 的 定义 ， 并 回顾 了 数据 库 设计 的 三 个 阶段 。16.2 节 对 该 
方法 学 进行 了 概述 ， 并 简要 描述 了 与 每 个 设计 阶段 相关 的 主要 活动 。16.3 节 重 点 讲述 了 数据 
库 概念 设计 的 方法 并 给 出 了 具体 的 概念 数据 模型 的 建 模 步骤 。 我 们 用 第 12 和 13 章 中 讲述 的 
实体 -联系 (ER) 模型 创建 概念 数据 模型 。 

第 17 章 重点 讲述 关系 模型 的 逻辑 数 据 库 设计 方法 学 ， 并 详细 描述 将 概念 数据 模型 转换 
成 远 辑 数据 模型 的 步 又。 逻辑 数据 库 设计 方法 学 中 还 包括 一 个 可 选 的 步骤 一 一 处 理 数 据 库 设 
计 中 多 用 户 视 图 的 方法 ， 即 如 何 利用 视图 集成 的 方法 将 两 个 或 多 个 逻辑 数据 模型 合并 为 一 个 
逻辑 数据 模型 的 方法 (参见 10.5 节 )。 第 17 章 描述 的 次 辑 数据 模型 是 接 下 来 的 两 章 将 描述 
的 数据 库 设计 最 后 一 个 阶段 工作 的 起 点 。 

第 18 章 和 第 19 章 详细 讨论 了 关系 DBMS 的 物理 数据 库 设 计 的 步骤 ， 从 而 完成 对 整个 数据 
库 设 计 方法 学 的 讨论 。 设 计 方 法 学 的 这 个 部 分 说 明 : 只 开发 逻辑 数据 库 模 型 并 不 足以 保证 数 
据 库 系统 的 最 优化 实现 。 例 如 ， 为 了 获得 可 接受 的 性 能 ， 我 们 可 能 不 得 不 对 避 辑 模型 进行 修改 。 
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对 于 那些 早已 熟悉 数据 库 设 计 ， 只 是 想 快速 回顾 一 下 数据 库 设计 主要 步骤 的 读者 ”可 以 
参见 附录 D， 附 录 D 是 数据 库 设 计 方法 学 的 概述 。 在 整个 方法 学 的 讨论 过 程 中 ， 用“ 实体” 
和 “联系 ”代替 术语 “实体 类 型 ”和 “联系 类 型 "*， 只 有 在 可 能 存在 歧义 时 才 加 上 “类 型 ”。 
本 章 大 部 分 内 容 的 示例 都 取 自 11.4 节 和 附录 A 描述 的 DreamHome 案例 研究 中 的 用 户 视 图 
StaffClient. 


16.1 数据 库 设 计 方 法 学 简介 

在 讲述 方法 学 之 前 ， 我 们 先 讨 论 设计 方法 学 包含 的 内 容 以 及 数据 库 设 计 的 三 个 阶段 。 之 
后 我 们 还 会 给 出 如 何 成 功 地 进行 数据 库 设 计 的 指导 方针 。 
16.1.1 什么 是 设计 方法 学 
设计 方法 学 | 一 种 结构 化 的 方法 ， 它 用 过 程 、 技 术 、 工 具 以 及 文档 等 辅助 手段 来 支持 和 简 
化 设计 过 程 。 


设计 方法 学 的 每 个 阶段 都 是 由 若干 步骤 组 成 的 ， 这 些 步 又 指导 设计 者 在 工程 的 各 个 阶 
段 采用 相应 的 合适 的 技术 。 设 计 方 法 学 同样 帮助 设计 者 对 数据 库 系统 开发 项 目 进行 计划 、 管 
理 、 控 制 和 评估 。 并 且 ， 设计 方法 学 是 结构 化 的 方法 ， 因 为 设计 方法 学 用 标准 化 和 组 织 化 的 
方式 对 数据 库 系 统 的 一 系列 需求 进行 分 析 和 建 模 。 


16.1.2 概念、 逻辑 和 物理 数据 库 设计 


在 数据 库 设计 方法 学 中 ,设计 过 程 被 分 成 三 个 主要 阶段 : 概念 数据 库 设计 、 人 逻辑 数据 库 
设计 和 物理 数据 库 设计 。 


| 概念 数据 库 设计 | 在 不 考虑 任何 物理 因素 的 情况 下 构建 企 事业 单位 数据 模型 的 过 程 。 


概念 数据 库 设计 从 创建 企 事 业 单位 的 概念 数据 模型 开始 ， 概 念 数据 模型 完全 独立 于 诸如 
目标 DBMS、 应 用 程序 、 编 程 语言 、 硬 件 平台 、 性 能 问题 或 其 他 物理 因素 等 实现 细节 。 


逻辑 数据 库 设 计 | 在 不 考虑 具体 DBMS 和 其 他 物理 因素 的 情况 下 基于 特定 数据 模型 构建 企 
事业 单位 的 数据 模型 的 过 程 。 


逻辑 数据 库 设计 阶段 将 概念 模型 映射 为 逻辑 模型 ， 该 逻辑 模型 受到 目标 数据 库 数 据 模型 
(如 关系 模型 ) 的 影响 。 逻 辑 数 据 模型 是 物理 设计 阶段 的 基础 ， 为 物理 数据 库 的 设计 者 进行 
全 面 考虑 和 权衡 提供 依据 ， 这 对 设计 高 效 的 数据 库 十 分 重要 。 
物理 数据 库 设 计 | 在 二 级 存储 器 上 实现 数据 库 的 过 程 ， 包 括 定义 基础 关系 、 文 件 组 织 、 用 
于 实现 高 效 数据 访问 的 索引 ， 以 及 相关 的 完整 性 约束 和 安全 机 制 。 

在 物理 数据 库 设 计 阶段 ,设计 者 可 以 自行 决定 实现 数据 库 的 方式 。 物 理 设计 因 DBMS 


而 异 。 在 物理 设计 和 逻辑 设计 之 间 存 在 着 反馈 过 程 ， 因 为 在 物理 设计 过 程 中 为 提高 性 能 所 采 
取 的 措施 可 能 会 影响 逻辑 数据 模型 。 


16.1.3 成 功 设计 数据 库 的 关键 因素 
通常 ， 下 面 几 点 对 数据 库 设计 的 成 功 与 否 至 关 重 要 : 
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尽 可 能 多 地 与 用 户 交 流 。 

在 数据 建 模 的 整个 过 程 中 遵循 结构 化 的 方法 学 。 

使 用 数据 驱动 方法 。 

在 数据 模型 中 综合 考虑 结构 性 和 完整 性 。 

数据 建 模 方法 学 应 结合 概念 化 、 规 范 化 和 事务 验证 技术 。 

尽 可 能 多 地 用 图 表 来 描述 数据 模型 。 i 
用 数据 库 设计 语言 (Database Design Language, DBDL) 来 描述 难以 用 图 表 表 达 的 数 
据 的 语义 。 

o 建立 数据 字典 对 数据 模型 图 和 DBDL 进行 补充 说 明 。 

e 自觉 地 迭代 。 

上 述 指导 原则 在 本 章 给 出 的 数据 库 设计 方法 学 中 得 到 了 综合 体现 。 


16.2 ”数据 库 设 计 方 法 学 概述 
本 节 对 数据 库 设 计 方 法 学 进行 概述 。 数 据 库 设 计 方 法 学 包括 以 下 步骤 。 
概念 数据 库 设 计 
步骤 1 建立 概念 数据 模型 
步骤 1.1 标识 实体 类 型 
步骤 1.2 标识 联系 类 型 
步骤 1.3 标识 属性 并 将 属性 与 实体 或 联系 类 型 相关 联 
步骤 1.4 确定 属性 域 
步骤 1.5 确定 候选 关键 字 、 主 关键 字 和 可 替换 关键 字 属 性 
步骤 1.6 考虑 使 用 增强 的 建 模 概念 (可 选 步骤 ) 
步骤 1.7 检查 模型 的 宛 余 
步骤 1.8 针对 用 户 事务 验证 概念 模型 
步骤 1.9 与 用 户 一 起 复查 概念 数据 模型 
关系 模型 的 逻辑 数据 库 设计 
步骤 2 建立 逻辑 数据 模型 
步骤 2.1 从 逻辑 数据 模型 中 导出 关系 
步骤 2.2 使 用 规范 化 方法 验证 关系 
步骤 2.3 ”针对 用 户 事务 验证 关系 
步骤 2.4 检查 完整 性 约束 
步骤 2.5 与 用 户 一 起 复查 逻辑 数据 模型 
步骤 2.6 将 逻辑 数据 模型 合并 为 全 局 模型 (可 选 步骤 ) 
步骤 2.7 检查 模型 对 未 来 可 拓展 性 的 支持 
关系 数据 库 的 物理 数据 库 设计 
PRI 转换 次 辑 数 据 模 型 以 适应 目标 DBMS 
步骤 3.1 设计 基础 关系 
步骤 3.2 设计 导出 数据 的 表示 方法 
步骤 3.3 设计 一 般 性 约束 
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步骤 4 设计 文件 组 织 方法 和 索引 
步骤 4.1 分 析 事 务 
步骤 4.2 选择 文件 组 织 方法 
步骤 4.3 选择 索引 
步骤 4.4 ”估计 所 需 的 磁盘 空间 

步 台 5 设计 用 户 视图 

步骤 6 设计 安全 机 制 

步骤 7 考虑 引入 可 控 宛 余 

步骤 8 监控 系统 和 系统 调 优 

从 相对 简单 的 数据 库 系统 到 高 度 复杂 的 数据 库 系 统 ， 都 可 以 使 用 上 述 方法 学 进行 数据 
库 系 统 的 设计 。 在 数据 库 系统 开发 的 生命 周期 (参见 10.6 节 ) 中 ， 数 据 库 设计 被 分 为 三 个 阶 
段 ， 分 别 为 概念 设计 、 逻 辑 设 计 和 物理 设计 。 因 此 ， 方 法 学 也 包含 三 个 相应 的 阶段 : 步骤 1 
是 概念 数据 库 设 计 ， 步 又 2 是 逻辑 数据 库 设 计 ， 步 又 3 到 步骤 8 是 物理 数据 库 设 计 。 根 据 要 
建立 的 数据 库 系 统 复 杂 度 的 不 同 ， 有 些 步骤 可 以 省 略 。 例 如 ， 对 于 不 管 是 单 用 户 视 图 的 数 
据 库 系统 ， 还 是 用 集中 式 方法 处 理 多 用 户 视图 的 数据 库 系统 (参见 10.5 节 )， 方 法 学 中 的 步 
又 2.6 都 显然 是 多 余 的 。 因 为 我 们 只 需要 在 步骤 1 中 创建 一 个 单一 的 概念 数据 模型 ， 或 者 在 
步骤 2 中 创建 一 个 单一 的 逻辑 数据 模型 就 可 以 了 。 如 果 数 据 库 设 计 人 员 在 设计 数据 库 系统 时 
使 用 了 视图 集成 的 方法 处 理 多 个 用 户 视图 (参见 10.5 节 )， 就 需要 反复 应 用 步骤 1 和 步骤 2， 
直到 完成 了 所 有 模型 的 创建 ， 然 后 在 步骤 2.6 再 将 这 些 模型 合并 。 

第 10 章 我 们 使 用 的 术语 “局 部 概念 数据 模型 ”和 “局 部 逻辑 数据 模型 ”是 指 对 数据 库 
系统 的 一 个 或 者 多 个 (不 是 全 部 ) 用 户 视图 建 模 ， 术 语 “ 全 局 逻辑 数据 模型 ” 则 指 对 数据 库 
系统 的 所 有 用 户 视图 建 模 。 在 方法 学 中 ， 除 了 可 选 步骤 2.6 外 ,使 用 的 都 是 一 般 性 的 术语 
“概念 数据 模型 ”和 “逻辑 数据 模型 "， 在 步骤 2.6 中 因为 要 描述 的 任务 是 将 各 个 局 部 逻辑 
数据 模型 合并 为 全 局 逻辑 数据 模型 ， 所 以 使 用 了 术语 “局 部 概念 数据 模型 ”和 “局 部 逻辑 数 
据 模型 ”。 \ | 

设计 方法 学 中 一 个 很 重要 的 方面 是 : 不 断 地 对 生成 的 模型 进行 验证 ， 以 保证 其 始终 能 够 
准确 地 反映 被 建 模 的 那 部 分 企 事业 单位 的 需求 。 在 数据 库 设 计 方 法 学 中 ， 可 以 使 用 多 种 方法 
对 数据 模型 进行 验证 ， 例 如 规范 化 (步骤 2.2 )、 确 保 对 关键 事务 的 支持 (步骤 1.8 和 2.3 )、 
要 求 尺 可 能 多 地 与 用 户 一 起 验证 数据 模型 (步骤 1.9 和 2.5 )。 

步骤 2 所 建立 的 逻辑 模型 是 步骤 3 到 步骤 8 进行 物理 数据 库 设计 的 基础 。 同 样 ， 根 据 数 
据 库 系统 的 复杂 性 以 及 目标 DBMS 的 功能 ， 物 理 数据 库 设 计 的 某 些 步骤 也 可 以 省 略 。 例 如 ， 
对 于 基于 PC 的 DBMS, 步骤 4.2 就 可 以 省 略 。 第 18 章 和 第 19 章 详细 讲述 了 物理 数据 库 设 
计 的 步骤 。 

数据 库 设计 是 一 个 反复 迭代 的 过 程 ， 其 不 断 求 精 的 过 程 几乎 没有 止境 。 尽 管 方法 学 的 步 
又 是 一 个 程序 式 的 过 程 ， 但 必须 强调 的 是 这 并 不 意味 着 实际 的 设计 过 程 就 是 按照 这 些 步骤 进 
行 的。 从 某 一 个 步骤 里 获得 的 信息 有 可 能 改变 前 一 个 步骤 的 结果 ， 同 样 ， 前 一 个 步骤 的 修改 
又 可 能 影响 后 面 的 步 又。 所 以 ， 方 法 学 就 是 一 个 框架 ， 它 引导 设计 者 有 效 地 进行 数据 库 设 计 。 

我 们 使 用 DreamHome 案例 研究 来 说 明 数 据 库 设 计 方 法 学 。DreamHome 数据 库 包含 多 
个 用 户 视图 (Director, Manager, Supervisor, Assistant 和 Client)， 并 使 用 视图 集成 和 集中 


- 的 方法 (参见 11.4 节 ) 来 处 理 它 们 。 应 用 集中 的 方法 生成 了 两 类 视图 : StaffClient 用 户 视图 
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和 Branch 用 户 视 图 。 这 两 类 视图 分 别 包括 : 

è StaffClient 用 户 视图 一 一 包括 了 主管 (Supervisor)、 助 理 (Assistant) 和 客户 (Client) 

的 用 户 视 图 。 

e Branch 用 户 视 图 一 一 包含 负责 人 (Director) 和 经 理 (Manager) 的 用 户 视图 。 

本 章 针 对 方法 学 中 的 步骤 1， 我 们 使 用 StaffClient 用 户 视 图 演示 如 何 创 建 概念 数据 模 
型 ， 下 一 章 则 讲述 在 步骤 2 中 如 何 将 这 个 模型 转换 成 逻辑 数据 模型 。 因 为 StaffClient 用 户 视 
图 只 代表 了 DreamHome 数据 库 的 所 有 用 户 视图 的 一 个 子 集 ， 因 此 这 里 所 说 的 数据 模型 就 应 
该 是 局 部 数据 模型 。 前 面 已 经 提 过 ， 为 了 简单 起 见 ， 在 方法 学 和 案例 描述 中 ,我 们 都 使 用 术 
语 “概念 数据 模型 ”和 “逻辑 数据 模型 ”， 一 直到 可 选 步骤 2.6 为 止 。 步 骤 2.6 将 描述 如 何 对 
局 部 逻辑 数据 模型 StaffClient 用 户 视图 和 Branch 用 户 视图 进行 集成 。 


16.3 ”概念 数据 库 设计 方法 学 
本 节 将 逐步 介绍 概念 数据 库 的 设计 。 


步骤 1 建立 概念 数据 模型 
| 目标 | 创建 一 个 满足 企 事业 单位 数据 需求 的 概念 数据 模型 。 


概念 数据 库 设 计 的 第 一 步 是 建立 一 个 (或 多 个 ) 满足 企 事 业 单 位 数据 需求 的 概念 数据 模 
型 。 一 个 概念 数据 模型 包括 : 
实体 类 型 
联系 类 型 
属性 和 属性 域 
主 关 键 字 和 可 替换 关键 字 
© 完整 性 约束 
概念 数据 模型 由 ER 图 、 数 据 字 典 等 文档 支持 ， 这 些 文档 是 在 模型 开发 过 程 中 逐步 生成 
的 。 在 后 面 的 每 个 步骤 中 我 们 都 将 说 明 该 步骤 生成 的 支持 文档 的 类 型 。 步 又 1 的 任务 是 : 
步骤 1.1 标识 实体 类 型 
步骤 1.2 标识 联系 类 型 
步骤 1.3 标识 属性 并 将 属性 与 实体 或 联系 类 型 相关 联 
步骤 1.4” 确定 属性 域 
步骤 1.5 确定 候选 关键 字 、 主 关键 字 和 可 替换 关键 字 属 性 
步骤 1.6 考虑 使 用 增强 的 建 模 概念 (可 选 步骤 ) 
步骤 1.7 检查 模型 的 宛 余 
PRIS ”针对 用 户 事务 验证 概念 模型 
步骤 1,9 与 用 户 一 起 复查 概念 数据 模型 


PRA 标识 实体 类 型 
| 目标 | 标识 所 需 的 实体 类 型 。 


创建 概念 数据 模型 的 第 一 步 是 定义 用 户 关心 的 主要 对 象 。 这 些 对 象 就 是 模型 的 实体 
类 型 (参见 12.1 节 )。 确 定 实体 的 一 种 方法 是 审查 用 户 需求 规格 说 明 书 。 我 们 可 以 标 出 需 
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求 规格 说 明 书 中 的 名 词 和 名 词 短 语 (如 员工 编号 、 员 工 姓 名 、 房 产 所 有 者 编号 、 房 产 所 有 
者 地 址 、 租 金 、 房 间 数 等 )。 当 然 ， 我 们 要 找 出 主要 的 对 象 ， 如 人 、 地 址 或 者 是 感 兴 趣 的 
概念 ， 排 除 那 些 仅仅 用 来 描述 对 象 性 质 的 名 词 。 比 如 ,我 们 可 以 将 员工 编号 和 员工 姓名 组 
成 一 个 名 为 Staff 的 对 象 或 者 实体 ， 将 房产 编号 、 房 产地 址 、 租 金 和 房间 数组 成 一 个 名 为 
PropertyForRent 的 实体 。 

确定 实体 的 另外 一 种 方法 就 是 查找 那些 客观 存在 的 对 象 。 比 如 说 Staff 是 一 个 实体 ， 因 
为 不 管 我 们 知 不 知道 他 们 的 名 字 、 职 务 以 及 出 生日 期 ， 员 工 都 会 客观 存在 。 可 能 的 话 ， 用 户 
应 该 协助 完成 这 个 任务 。 

由 于 用 户 的 需求 规格 说 明 书 的 表达 方式 各 不 相同 ， 所 以 确定 实体 有 时 会 比较 困难 。 用 户 
经 常 采 用 例子 和 类 比 。 比 如 用 户 通常 直接 提 到 某 人 的 名 字 ， 而 不 用 我 们 所 需要 的 一 般 意 义 上 
的 “员工 ”这 个 名 词 。 有 时 ， 用 户 使 用 工作 角色 之 类 的 名 词 ， 特 别 是 经 常 使 用 某 个 人 所 属 的 
单位 名 称 。 这 些 角 色 可 能 是 王 作 头衔 或 职务 ， 如 负责 人 人、 经理 、 主 管 或 助理 等 。 

用 户 经 稼 混用 同义词 或 歧义 词 ， 从 而 使 事情 变 得 更 复杂 。 意 义 相 同 的 两 个 词 叫 同 义 词 ， 
例如 ,，“ branch” 和 “ office”。 歧 义 词 是 指 在 不 同 的 上 下 文中 有 不 同 含义 的 词 。 例 如 ， 单 词 
“program ”有 几 种 不 同 的 意思 ， 如 一 种 学 习 的 课程 、 一 系列 事件 、 一 个 工作 计划 或 一 段 电 
视 节 目 。 

某 个 对 象 是 否 就 是 实体 、 联 系 或 者 属性 并 不 总 是 显而易见 的 。 例 如 ， 婚 姻 应 该 归 为 哪 一 
类 ? 事实 上 ， 根 据 实 际 需 求 ， 它 既 可 以 属于 三 者 中 的 任 一 类 型 也 可 同时 属于 三 种 类 型 。 设 计 
是 主观 的 ， 不 同 的 设计 者 可 能 有 不 同 的 设计 ， 但 是 这 些 设计 都 应 该 同等 有 效 ， 并 且 在 解释 上 也 
应 该 是 等 同 的 。 因 此 在 某 种 程度 上 ， 这 个 过 程 依赖 于 设计 者 的 判断 力 和 经 验 。 数 据 库 设计 者 必 
须 对 现实 世界 做 出 一 定 的 取舍 ， 并 对 所 观察 的 企 事 业 单位 内 部 情况 进行 分 类 。 因 此 ， 根 据 所 给 
的 需求 规格 说 明 书 ， 不 一 定 总 会 推导 出 唯一 的 实体 类 型 集 。 但 设计 过 程 的 不 断 和 迭代 至 少 会 选 
出 满足 系统 需求 的 实体 。 对 于 DreamHome 的 StaffClient 用 户 视图 ， 我 们 标识 出 如 下 实体 : 


Staff PropertyForRent 
PrivateOwner BusinessOwner 
Client Preference 
Lease 


用 文档 记录 实体 类 型 

标识 出 实体 类 型 后 ， 应 为 其 指定 有 意义 并 且 很 容易 被 用 户 理 解 的 名 字 ， 并 且 将 这 些 实体 
的 名 字 及 描述 记录 在 数据 字典 中 。 如 果 可 能 ， 记 录 每 个 实体 期 望 出现 的 次 数 。 如 果 一 个 实体 
有 多 个 名 字 ， 则 把 它们 定义 为 同义词 或 别名 ， 并 记录 到 数据 字典 中 。 图 16-1 显示 了 数据 字 
典 的 一 部 分 ， 记录 了 DreamHome 中 StaffClient 用 户 视 图 的 实体 。 
FYE 1.2 标识 联系 类 型 
| 目的 | 标识 实体 类 型 之 间 的 重要 联系 。 


标识 实体 后 ， 下 一 步 就 是 标识 所 有 存在 于 这 些 实体 间 的 联系 (参见 12.2 节 )。 标 识 实体 
的 一 种 办 法 就 是 找 出 用 户 需 求 规格 说 明 书 中 出 现 的 名 词 。 同 样 ， 我 们 可 以 用 需求 规格 说 明 书 
中 的 文法 来 识别 联系 。 通 常 ， 联 系 体现 在 动词 或 动词 词组 上 面 ; 例如 : 

è Staff Manages PropertyForRent (员工 管理 房产 ) 

@ PrivateOwner Owns PropertyForRent (业主 拥有 房产 ) 

@ PropertyForRent AssociatedWith Lease (房产 关联 着 租约 ) 
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图 16-1 节选 数据 字典 关于 DreamHome 的 StaffClient 用 户 视图 中 实体 的 描述 


需求 规格 说 明 书 之 所 以 记录 这 些 联系 ， 是 因为 它们 对 企 事业 单 位 很 重要 ， 因 此 在 模型 中 
应 该 包含 它们 。 我 们 只 对 实体 之 间 需 要 的 联系 感 兴 趣 。 

上 例 中 ,我 们 标识 出 了 Staff Manages PropertyForRent 和 PrivateOwner Owns PropertyForRent 
两 种 联系 。 当 然 ， 也 可 以 考虑 Staff Al PrivateOwner 之 间 的 联系 (例如 Staff Assists Private- 
Owner (员工 帮助 业主 ))。 尽 管 它 是 一 种 可 能 的 联系 ， 但 从 需求 规格 说 明 书 来 看 ， 建 模 时 并 
不 需要 它 。 

大 多 数 情况 下 ， 联 系 是 二 元 的 ， 即 联系 仅 存 在 于 两 个 实体 类 型 之 间 。 但 我 们 也 要 注意 多 
个 实体 类 型 之 间 的 复杂 联系 (参见 12.2.1 节 ) 以 及 单个 实体 类 型 的 递归 联系 (参见 12.2.2 节 )。 

设计 者 必须 仔细 分 析 ， 确 保 识别 出 用 户 需 求 规格 说 明 书 中 显 式 或 隐 式 说 明 的 所 有 联系 。 
原则 上 说 ， 应 该 检查 每 一 对 实体 类 型 ， 找 出 所 有 潜在 的 联系 。 但 是 ， 这 对 于 一 个 包含 几 百 个 
实体 类 型 的 大 系统 来 说 过 于 复杂 。 另 一 方面 ， 不 做 这 样 的 检查 又 不 太 明 智 ， 这 通常 是 分 析 员 
和 设计 员 的 责任 。 不 过 ， 当 我 们 针对 要 支持 的 事务 验证 模型 时 也 应 该 很 容易 发 现 那些 遗漏 的 
联系 (步骤 1.8 )。 

使 用 实体 - 联系 (ER) 

用 可 视 化 的 方式 描述 复杂 系统 通常 要 比 使 用 大 长 的 文本 描述 容易 得 多 。 使 用 ER 图 来 摘 
述 实体 和 它们 之 间 的 联系 要 更 简单 一 些 。 在 数据 库 设计 的 整个 阶段 ， 强 烈 建议 在 需要 的 时 候 
尽量 使 用 ER 图 来 表示 企 事 业 单 位 建 模 的 各 个 部 分 。 本 书 使 用 最 新 的 面向 对 象 表示 方法 一 一 
统一 建 模 语言 (UML)， 不 过 其 他 表示 方法 也 可 以 完成 类 似 的 功能 ( 见 附录 C)。 
确定 联系 类 型 的 多 重 性 约束 

联系 确定 以 后 ， 下 一 步 就 是 要 确定 每 一 种 联系 的 多 重 性 (参见 12.6 节 )。 如 果 已 经 知道 
联系 的 多 重 性 的 取 值 ， 或 者 知道 取 值 的 上 限 和 下 限 ， 那 么 直接 记录 下 来 就 可 以 了 。 

多 重 性 约束 主要 用 于 检查 和 维护 数据 。 更 新 数据 库 时 ， 可 以 根据 多 重 性 约束 判断 此 次 
更 新 是 否 违 反 了 企 事 业 单 位 声明 的 规定 ， 因 此 多 重 性 约束 是 实体 的 实例 出 现 能 否 被 录入 的 准 
则 。 具 有 多 重 性 约束 的 模型 能 够 更 加 明确 地 表述 联系 的 语义 ， 从 而 更 好 地 表示 企 事 业 单位 的 
数据 需求 。 
检查 扇形 陷阱 和 断层 陷阱 

必要 的 联系 确定 以 后 ， 还 要 检查 ER 模型 中 的 每 个 联系 是 否 准 确 地 描述 了 “现实 世界 ”， 
确保 没有 无 意 中 形 成 的 扇形 陷阱 和 断层 陷阱 (参见 12.7 节 )。 

图 16-2 为 DreamHome 案例 中 用 户 视图 StaffClient 的 ER 图 的 初步 构想 。 
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图 16-2 DreamHome 中 用 户 视图 StaffClient 的 实体 和 联系 类 型 的 ER 图 


用 文档 记录 联系 类 型 

确定 好 联系 类 型 以 后 ， 还 要 赋予 它们 有 意义 并 且 容 易 被 用 户 理解 的 名 字 。 同 时 还 要 在 数 
据 字 典 中 记录 联系 的 描述 以 及 多 重 性 约束 。 图 16-3 显示 了 数据 字典 中 关于 DreamHome 的 用 
户 视图 StaffClient 的 部 分 内 容 。 





图 16-3 ”节选 数据 字典 中 关于 DreamHome 的 用 户 视图 StaffClient 的 联系 的 描述 


步 又 1.3 标识 属性 并 将 属性 与 实体 或 联系 类 型 相关 联 
| 目标 | 将 属性 与 相应 的 实体 和 联系 类 型 关联 在 一 起 。 


方法 学 的 下 一 个 步骤 就 是 要 确定 那些 已 经 被 选 定 要 在 数据 库 中 表示 的 实体 和 联系 的 
属性 。 类 似 于 实体 的 确定 ， 我 们 继续 在 用 户 需 求 规格 说 明 书 中 寻找 名 词 和 名 词 短 语 。 若 名 
词 或 名 词 短 语 是 实体 或 联系 的 一 种 特性 、 性 质 、 标 识 符 或 特征 时 ， 即 可 标识 为 属性 (参见 
12:3, $ Ja 

当 我 们 已 经 在 需求 规格 说 明 书 中 标识 出 了 实体 (x) 或 联系 (y) 以 后 ， 接 下 来 就 可 以 问 
目 己 “ 对 于 x 或 y， 我 们 需要 保留 它们 的 哪些 信息 ? ”到 现在 为 止 这 是 确定 属性 最 简单 的 方 
法 ， 而 问题 的 答案 应 该 在 需求 规格 说 明 书 中 有 清楚 的 描述 。 但 是 某 些 情况 下 ， 可 能 还 有 必要 
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DS] see et A KS Ved AS a Zid FA PB 
简单 / 组 合 属 性 

判别 属性 是 简单 属性 还 是 组 合 属性 十 分 重要 (参见 12.3.1 节 )。 组 合 属性 由 简单 属性 
构成 。 例 如 ，address 属性 可 以 是 简单 属性 ， 它 将 所 有 的 地 址 细节 作为 一 个 单 值 ， 如 “115 
Dumbarton Road, Glasgow, G11 6YG” 。 然 而 ， 该 地 址 也 可 被 视 为 一 个 组 合 属性 ， 它 由 若 
干 简单 属性 组 成 ， 比 如 street ( “115 Dumbarton Road”)、city (“ Glasgow” ) 和 postcode 
(“G11 6YG”)。 选 择 用 简单 属性 还 是 组 合 属性 描述 地 址 ， 取 决 于 用 户 的 需求 。 如 果 用 户 
不 需要 单独 访问 地 址 中 的 某 个 组 成 部 分 ， 就 可 以 将 address 作为 一 个 简单 属性 处 理 ， 反 之 ， 
address 就 要 作为 组 合 属 性 ， 由 所 需 的 简单 属性 构成 。 

在 这 个 步骤 中 ， 重 要 的 是 我 们 要 标识 出 概念 数据 建 模 中 的 所 有 简单 属性 ， 包 括 那些 组 成 
组 合 属 性 的 属性 。 

单 值 / 多 值 属性 

属性 除了 有 简单 和 合成 之 分 外 ， 还 有 单 值 或 多 值 的 分 别 (参见 12.3.2 节 )。 大 多 数 属性 
都 是 单 值 的 ， 但 也 会 有 一 些 多 值 属 性 ， 即 一 个 实体 的 某 个 属性 可 能 有 多 个 值 。 例 如 ， 实 体 
Client 的 telNo (电话 号 码 ) 属性 就 可 以 是 多 值 属性 。 

另 一 方面 ， 客 户 的 电话 号 码 也 可 被 视 为 独立 于 客户 的 另 一 实体 。 在 设计 模型 时 ， 这 两 种 
方案 都 是 可 行 的 ， 而 且 同 样 有 效 。 在 步骤 2.1 中 我 们 会 看 到 ， 多 值 属 性 被 映射 为 关系 ， 所 以 
两 种 方法 产生 的 结果 是 一 样 的 。 
导出 属性 

其 值 依赖 于 其 他 属性 值 的 属性 称 为 导出 属性 (参见 12.3.3 节 )。 导 出 属性 的 例子 包括 : 

e 员工 的 年 龄 

e 一 个 员工 管理 的 房产 数量 

o 押 租 〈 一 般 按 两 倍 月 租 计 算 ) 

一 般 情 况 下 ， 导 出 属性 不 在 概念 数据 模型 中 摘 述 。 但 有 时 候 导 出 属性 依赖 的 属性 和 属性 
值 会 被 删除 或 修改 ， 此 时 导出 属性 就 必须 在 概念 数据 模型 中 描述 ， 以 避免 可 能 的 信息 丢失 。 
如 果 一 个 导出 属性 出 现在 模型 中 ， 就 必须 注 明 它 是 导出 的 。 导 出 属性 的 表示 形式 将 在 物理 数 
据 库 设 计时 考虑 。 根 据 导出 属性 使 用 方式 的 不 同 ， 导 出 属性 的 值 可 在 每 次 被 访问 时 计算 , 或 
者 在 其 所 依赖 的 属性 值 发 生变 化 时 计算 。 不 过 ， 概 念 数据 库 设计 并 不 关心 这 个 问题 ， 这 部 分 
内 容 将 在 第 18 章 讲述 步骤 3.2 时 详细 讨论 。 
潜在 问题 

在 为 视图 标识 实体 、 联 系 和 属性 时 ， 和 常常 会 从 最 初始 的 选择 中 遗漏 一 个 或 多 个 实体 、 联 
系 或 者 属性 。 这 种 情况 下 ， 我们 需要 返回 到 前 面 的 步骤 ， 记 录 新 确定 的 实体 、 联 系 或 属性 ， 
并 重新 检查 所 有 相关 的 联系 。 

通常 属性 的 数量 要 比 实体 和 联系 多 ， 最 好 先 对 用 户 需 求 规格 说 明 书 中 给 出 的 所 有 属性 做 
个 列表 。 一 旦 发 现 某 个 属性 和 某 个 实体 或 联系 相关 联 ， 就 从 列表 中 删除 该 属性 。 这 样 能 确保 
一 个 属性 只 与 一 个 实体 或 联系 类 型 关联 。 当 列表 为 空 时 ， 所 有 属性 就 都 和 实体 或 联系 类 型 关 
联 起 来 了 。 , 

要 当心 可 能 存在 一 个 属性 与 多 个 实体 或 联系 类 型 相关 联 的 情形 ， 原 因 可 能 是 : 

(1) 我 们 已 经 确定 了 多 个 实体 ， 其 实 这 些 实体 可 以 被 抽象 为 一 个 实体 。 例 如 ， 我 们 可 


(2) 
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能 已 经 确定 了 实体 Assistant 和 Supervisor， 它 们 都 包含 属性 staffNo (员工 编号 )、 
name, sex fil DOB (出 生日 期 )， 其 实 这 两 个 实体 都 可 以 用 实体 Staff 来 表示 ， 而 
Staff 的 属性 包括 staffNo、name、sex、DOB 和 position (其 值 可 以 是 助理 (Assistant) 
也 可 以 是 主管 (Supervisor) ) 。 另 一 方面 ， 这 些 实体 也 可 能 共同 拥有 某 些 属性 ， 然 
后 又 各 目 拥 有 一 些 特殊 的 属性 。 这 时 ， 我 们 必须 决定 是 将 这 些 实体 泛 化 为 一 个 单 
一 的 实体 (如 Staff)， 还 是 将 它们 作为 分 别 表示 不 同 职业 角色 的 特殊 化 实体 来 对 待 。 
关于 特殊 化 还 是 泛 化 实体 的 问题 已 经 在 第 13 章 中 讨论 过 ， 在 步骤 1.6 中 还 将 有 更 
详细 的 说 明 。 

我 们 在 实体 类 型 间 已 确定 了 一 个 联系 。 此 时 ， 属 性 只 能 与 唯一 一 个 实体 ， 就 是 父 
实体 关联 ， 并 确保 该 联系 已 在 前 面 的 步骤 1.2 中 被 标识 。 如 果 不 是 这 样 ， 就 应 该 
更 新 文档 ， 将 新 确定 的 联系 写 人 人 文档。 例如， 假设 我 们 已 经 确定 了 实体 Staff 和 
PropertyForRent 及 其 属性 : 


Staff staffNo, name, position, sex, DOB 
PropertyForRent propertyNo, street, city, postcode, type, rooms, rent, managerName 


PropertyForRent 中 ， 属 性 managerName 表示 联系 Staff Manages PropertyForRent. 此 
时 ， 应 该 将 属性 managerName 从 PropertyForRent 中 删 掉 ， 并 增加 联系 Manages. 
DreamHome 中 实体 的 属性 

对 于 DreamHome 的 用 户 视图 StaffClient， 我 们 可 以 确定 以 下 实体 及 其 属性 : 


Staff 


> 


staffNo, name ( 由 属性 fName, IName 组 合 ), position, sex, DOB 


PropertyForRent propertyNo, address (由 属性 street, city, postcode 组 合 ), type, rooms, rent 
PrivateOwner ownerNo, name ( 由 属性 fName, IName 组 合 ), address, telNo 
BusinessOwner ownerNo, bName, bType, address, telNo, contactName 


Client clientNo, name ( 由 属性 fName, IName 组 合 ), telNo, eMail 
Preference prefType, maxRent 
Lease leaseNo, paymentMethod, deposit ( deposit = PropertyForRent.rent*2 tH ), 
depositPaid, rentStart, rentFinish, duration ( H duration = rentFinish— 
rentStart-# tH ) 
DreamHome 中 联系 的 属性 


一 些 属性 不 应 该 和 实体 关联 ， 而 应 该 和 联系 相关 联 。 对 于 DreamHome 的 用 户 视 图 
StaffClient， 属 性 与 联系 关联 的 情况 如 下 : 


Views viewDate, comment 


用 文档 记录 属性 
确定 了 属性 以 后 ， 还 要 为 它们 指派 对 用 户 而 言 有 意义 的 名 字 。 每 个 属性 需要 被 记录 的 信 


Bafi: 


属性 名 和 说 明 。 

数据 类 型 和 长 度 。 

该 属性 已 知 的 所 有 别名 。 

属性 是 否 为 组 合 的 ， 如 果 是 则 给 出 组 成 它 的 简单 属性 。 
该 属性 是 否 为 多 值 的 。 

该 属性 是 否 为 导出 的 ， 如 果 是 应 如 何 计算 它 。 

该 属性 的 默认 值 。 
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图 16-4 给 出 了 数据 字典 中 记录 DreamHome 中 用 户 视 图 StaffClient 的 属性 的 部 分 内 容 。 
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图 16-4 节选 数据 字典 中 关于 DreamHome 中 用 户 视 图 StaffClient 的 属性 的 描述 


步骤 1.4 ”确定 属性 域 
| 目标 | 确定 概念 数据 模型 中 属性 的 域 。 


步骤 1.4 的 目的 是 为 模型 中 的 所 有 属性 确定 域 (参见 12.3 节 )。 域 是 值 集 ， 一 个 或 多 个 
属性 可 以 从 中 取 值 。 例 如 ， 可 以 定义 : 
e 合法 员工 编号 (staffNo) 的 属性 域 是 五 个 字符 长 的 字符 串 ， 头 两 个 是 字母 ， 接 着 三 个 
是 数字 ， 数 字 范 围 是 1 一 999。 
e 实体 Staff 的 属性 sex 的 可 能 的 值 要 么 是 “M”， 要 么 是 “F”。 这 个 属性 的 域 是 单字 
符 的 字符 串 ， 由 “M” 或 “F” 构 成 。 
完善 的 数据 模型 应 为 每 个 属性 指定 域 ， 包括: 
e 属性 的 合法 值 的 集合 。 
e 属性 的 存储 空间 大 小 和 格式 。 
还 有 更 多 的 信息 可 用 于 说 明 域 ， 如 属性 上 人 允许 的 操作 ， 哪 些 属 性 可 以 相互 比较 ， 或 者 哪 
些 属性 可 以 相互 组 合 。 不 过 ， 如 何在 DBMS 中 实现 属性 域 的 这 些 特 性 仍然 处 于 研究 阶段 。 
用 文档 记录 属性 域 
确定 属性 域 后 ， 在 数据 字典 中 记录 属性 域 的 名 字 和 特性 。 更 新 数据 字典 ， 用 属性 域 蔡 代 
属性 的 数据 类 型 和 长 度 信息 。 


FUR 1.5 确定 候选 关键 字 、 主 关键 字 和 可 替换 关键 字 属 性 


目标 | 为 每 个 实体 类 型 确定 候选 关键 字 ， 如 果 有 多 个 候选 关键 字 ， 则 选择 一 个 作为 主 关 键 
字 ， 其 他 作为 可 替换 关键 字 。 


这 个 步骤 主要 考虑 为 实体 确定 候选 关键 字 ， 并 选择 其 中 一 个 作为 主 关键 字 (参见 12.3.4 
节 )。 候 选 关 键 字 是 实体 中 可 以 唯一 确定 该 实体 每 个 出 现 的 最 小 属性 集合 。 我 们 可 以 确定 出 多 
个 候选 关键 字 ， 然 而 必须 从 中 选择 一 个 作为 主 关键 字 ， 剩 下 的 候选 关键 字 称 为 可 替换 关键 字 。 

人 名 通常 做 不 了 候选 关键 字 。 例 如 ， 读 者 可 能 认为 组 合 属性 name 即 员工 的 姓名 适合 作 
为 实体 Staff 的 候选 关键 字 。 然 而 ，DreamHome 中 有 可 能 两 个 人 同名 ,很 显然 ，name 作为 
候选 关键 字 是 不 合适 的 。 同 样 ，DreamHome 中 的 业主 的 名 字 也 有 类 似 的 问题 。 这 种 情况 下 ， 
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尽管 我 们 可 以 考虑 将 若干 属性 组 合 在 一 起 以 满足 唯一 性 ， 但 更 好 的 方法 是 使 用 一 个 已 存在 
并 能 保证 唯一 性 的 属性 ， 如 实体 Staff 的 属性 staffNo 和 实体 PrivateOwner 的 属性 ownerNo, 
或 者 定义 一 个 新 的 能 保证 唯一 性 的 属性 。 | 

从 候选 关键 字 中 选择 主 关键 字 时 ， 可 以 参考 以 下 原则 : 

e 包含 属性 个 数 最 少 的 候选 关键 字 。 

e 属性 值 被 修改 的 可 能 性 最 小 的 候选 关键 字 。 

© 字符 数 最 少 的 候选 关键 字 (对 于 文本 属性 )。 

e 最 大 值 最 小 的 候选 关键 字 (对 于 数值 属性 )。 

e 从 用 户 的 角度 看 最 容易 使 用 的 关键 字 。 

在 确定 主 关 键 字 的 过 程 中 ， 要 注意 实体 的 强 弱 。 如 果 能 为 一 个 实体 指定 主 关键 字 ， 该 实 
体 就 是 强 实体 ， 否 则 就 是 弱 实 体 (参见 12.4 节 )。 可 以 通过 设置 外 部 关键 字 ， 将 弱 实体 和 其 
所 有 者 实体 关联 起 来 ， 然 后 确定 弱 实体 的 主 关 键 字 。 步 又 2.1 描述 了 将 实体 和 实体 间 的 联系 
映 冉 为 关系 的 过 程 ， 到 这 一 步 才能 为 弱 实 体 指定 主 关 键 字 。 
DreamHome 的 主 关 键 字 

图 16-5 中 给 出 了 DreamHome 的 StaffClient 用 户 视 图 的 主 关键 字 。 注 意 Preference 实体 
是 个 弱 实 体 ， 联 系 Views 有 两 个 属性 : viewDate 和 comment。 
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图 16-5 增加 了 主 关 键 字 的 DreamHome 的 StaffClient 用 户 视图 的 ER 图 
用 文档 记录 主 关 键 字 和 可 替换 关键 字 


在 数据 字典 中 记录 主 关 键 字 和 所 有 可 替换 关键 字 的 标识 。 
步骤 1.6 考虑 使 用 增强 的 建 模 概念 (可 选 步 又 ) 


| 目标 | 考虑 使 用 增强 的 建 模 概 念 ， 如 特殊 化 / 泛 化 、 聚 合 和 组 合 。 
在 这 个 步骤 中 ， 可 选择 使 用 第 13 章 中 讨论 的 特殊 化 / 泛 化 、 聚 合 和 组 合 等 高 级 建 模 概 
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念 ， 继 续 改进 ER 模型 。 如 果 使 用 特殊 化 方法 ， 就 要 定义 一 个 或 多 个 子 类 或 超 类 实体 来 体现 
实体 间 的 不 同 。 如 果 使 用 泛 化 方法 ， 就 要 寻找 实体 间 的 共同 特征 ， 以 定义 一 个 泛 化 的 超 类 实 
体 。 可 以 使 用 聚合 表示 实体 间 的 “拥有 ”或 “属于 ”联系 ， 其 中 一 个 实体 是 “整体 ”， 另 一 
个 则 是 “部 分 ”。 可 以 使 用 组 合 (一 个 特殊 的 聚合 ) 表示 在 “整体 ”和 “部 分 ”之 间 具 有 强 
附属 关系 以 及 相同 的 生命 周期 。 

对 于 DreamHome 的 StaffClient 用 户 视图 ， 对 PrivateOwner 和 BusinessOwner 这 两 个 实 
体 进行 泛 化 ， 创 建 一 个 包含 公共 属性 ownerNo, address 和 telNo 的 超 类 Owner。 超 类 Owner 
和 它 的 子 类 之 间 是 强制 参与 和 不 相交 的 联系 ， 记 为 {Mandatory, Or}: 超 类 Owner 的 每 一 个 
成 员 必 须 是 其 中 一 个 子 类 的 成 员 ， 但 不 能 同时 属于 两 个 。 

此 外 ， 我 们 创建 Staff 的 一 个 特殊 化 子 类 Supervisor， 并 特别 构建 联系 Supervises。 超 类 
Staff 和 子 类 Supervisor 的 联系 是 可 选 参与 的 ， 超 类 Staff 的 成 员 不 必 是 子 类 Supervisor 的 成 
员 。 为 了 使 设计 简单 ， 我 们 不 使 用 聚合 和 组 合 。 修 改 后 的 DreamHome 的 StaffClient 用 户 视 
图 的 ER 图 如 图 16-6 所 示 。 


Supervisor 


Supervises {Optional} 
v Z 







0..* 
下 1..1 m 


Holds States 


AssociatedWith 
v y v 


Pe 


z. Lease + 1.1 Preference 


个 {Mandatory, Or} 


PrivateOwner BusinessOwner 


图 16-6 ”特殊 化 / 泛 化 后 的 DreamHome 的 StaffClient 用 户 视 图 的 ER 图 


在 选用 高 级 建 模 概念 开发 ER 模型 时 没有 严格 的 规定 ， 基 本 上 取决 于 设计 者 的 主观 意志 
以 及 所 建 模 型 的 特征 。 从 经 验 来 说 ， 选 择 使 用 这 些 概念 时 ， 要 能 使 ER 图 尽 可 能 清楚 地 表示 
重要 的 实体 以 及 它们 之 间 的 联系 。 因 此 ， 应 根据 ER 图 的 可 读 性 ， 以 及 描述 重要 实体 和 联系 
时 的 清晰 程度 决定 高 级 建 模 概念 的 选用 。 
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虽然 这 些 概念 是 和 增强 的 ER 模型 相关 的 ， 但 因 这 一 步 是 可 选 的 ， 所 以 在 整个 方法 学 中 
仍然 简单 地 用 “ER 图 ”代表 数据 模型 的 图 形 表示 。 


BYR 1.7 检查 模型 的 元 余 
| 目标 | 检查 模型 中 任何 存在 的 宛 余 。 


步骤 1.7 检查 概念 数据 模型 中 是 否 存 在 任何 见 余 ， 夺 有 ， 则 删除 它们 。 这 一 步 主 要 的 活 
动 有 : 

。 重新 检查 一 对 一 (1:1) 联系 。 

© 删除 元 余 的 联系 。 

e 考虑 时 间 因 素 。 
(1) 重新 检查 一 对 一 (1:1) KA 

在 确定 实体 的 过 程 中 ， 可 能 发 现 两 个 实体 表示 企 事 业 单位 中 的 同一 个 对 象 。 例 如 ， 可 能 
确定 两 个 实际 上 相同 的 实体 Client 和 Renter, fie, Client 和 Renter 是 同义词 。 这 种 情 
况 下 ， 两 个 实体 应 该 合 为 一 个 。 如 果 主 关键 字 不 同 ， 选 择 一 个 作为 主 关键 字 ， 将 另外 一 个 作 
为 可 替换 关键 字 。 
(2) 删除 完 余 的 联系 

如 果 一 个 联系 表示 的 信息 能 通过 其 他 联系 获得 ， 这 个 联系 就 是 元 余 的 。 我 们 要 努力 创 
建 最 小 的 数据 模型 ， 所 以 宛 余 的 联系 是 不 必要 的 ， 应 该 删除 。 注 意 ,， 昌 然 确定 两 个 实体 间 
是 否 存 在 多 个 路 径 比 较 容 易 ， 但 这 不 意味 着 某 个 联系 就 是 多 余 的 ， 它 们 完全 可 能 表示 两 个 
实体 间 不 同 的 关联 。 人 例如， 考虑 图 16-7 Remove the redundant 
中 给 出 的 实 体 Property orket ed Eedse relationship called Rents 


和 Client 之 间 的 联系 。 在 实体 Property- 
ForRent 和 Client 之 间 有 一 条 直接 路 
propertyNo a 

















径 ， 即 联系 Rents， 还 有 一 条 间接 路 径 ， 
即 通过 中 间 实 体 Lease 的 联系 Holds 和 
AssociatedWith。 在 判断 这 两 条 路 径 是 否 
都 需要 之 前 ， 我 们 要 先 弄 清楚 创建 这 两 
条 路 径 的 目的 。 联 系 Rents 表示 某 个 客 、 ; 
户 租用 某 处 房产 。 另 一 方面 ， 联 系 Holds ~ 
表示 某 个 客户 是 一 个 租用 关系 的 实施 者 ， 
联系 AssociatedWith 则 表示 该 租用 关系 图 16-7 删除 元 余 联 系 Rents 
的 租用 对 象 是 某 人 处 房产 。 现 实生 活 中 ,尽管 在 客户 和 他 们 租用 的 房产 之 间 确 实 存在 联系 ,但 
一 般 不 是 直接 联系 ， 这 种 联系 通过 租用 关系 关联 显得 更 加 准确 。 因 此 ， 联 系 Rents 是 一 个 宛 
余 联系 ， 因 为 它 并 没有 表示 出 实体 PropertyForRent 和 Client 之 间 更 多 的 、 用 通过 实体 Lease 
的 间接 关联 无 法 正确 表示 的 信息 。 为 了 创建 最 小 化 的 模型 ， 元 余 联 系 Rents 必须 删除 。 
(3) 考虑 时 间 因 素 

在 考虑 元 余 时 ,联系 的 时 间 因 素 很 重要 。 例 如 ， 考 虑 这 样 的 情形 在 实体 Man, 
Woman 和 Child 之 间 建 立 联 系 ， 如 图 16-8 所 示 。 很 明显 ， 在 Man 和 Child 之 间 有 两 个 路 径 : 
一 个 是 通过 直接 联系 FatherOf， 另 一 个 则 是 通过 联系 MarriedTo 和 MotherOf。 进 而 ， 我 们 
就 会 认为 联系 FatherOf 是 不 必要 的 ， 然 而 这 并 不 正确 ， 原 因 是 : 


AssociatedWith 
y 
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e 父亲 可 能 会 因为 先前 的 婚姻 而 有 孩子 ， 而 该 模型 中 只 用 一 个 一 对 一 联系 表述 父亲 当 
前 的 婚姻 情况。 

o 父亲 和 和 母亲 可 能 没有 结婚 ， 或 者 
父亲 与 不 是 孩子 母亲 的 人 结婚 
(或 者 母亲 与 不 是 孩子 父亲 的 人 
结婚 )。 

无 论 哪 种 情况 ， 没 有 FatherOf 联系 
的 话 ， 所 需要 的 联系 就 不 能 构建 出 来 。 
这 个 例子 说 明 在 考虑 元 余 时 ， 检 查实 体 
间 的 每 个 联系 的 含义 都 很 重要 。 最 后 ， 
我 们 通过 删除 任何 内 在 的 元 余 简 化 了 局 图 16-8” 非 元 余 联 系 FatherOf 的 例子 
部 概念 数据 模型 。 


步骤 1.8 针对 用 户 事务 验证 概念 模型 
| 目标 | 确保 概念 模型 支持 所 需要 的 事务 。 


至 此 我 们 已 经 有 了 一 个 表示 企 事 业 单 位 数据 需求 的 概念 数据 模型 。 本 步骤 的 目的 是 检查 
模型 以 确保 模型 支持 所 需要 的 事务 。 在 这 个 模型 的 基础 上 ， 我 们 尝试 以 手工 的 方式 模拟 运行 
企 事业 单位 的 业务 。 如 果 能 用 这 种 方法 完成 所 有 事务 ,我们 就 能 验证 这 个 概念 数据 模型 是 支 
持 这 些 事务 的 。 然 而 ， 如 果 某 个 事务 不 能 手工 完成 ， 则 数据 模型 肯定 存在 必须 解决 的 问题 。 
出 现 这 种 情况 的 原因 可 能 是 数据 模型 中 遗漏 了 某 个 实体 、 联 系 或 属性 。 

可 以 通过 两 个 步骤 验证 概念 数据 模型 是 否 支 持 所 需要 的 事务 : 

es 描述 事务 

e 使 用 事务 路 径 
描述 事务 

在 这 个 步骤 中 ， 用 文档 写 出 模型 中 每 个 事务 的 需求 ， 我 们 就 可 以 检验 该 模型 是 否 支 持 
每 个 事务 需要 的 所 有 信息 (实体 、 联 系 和 属性 )。 下 面 以 附录 A 中 列举 的 DreamHome 的 
StaffClient 用 户 视图 的 事务 为 例 进 行 说 明 : 

事务 (d): 列 出 由 某 分 公司 某 位 员工 监管 的 房产 的 详细 清单 
房产 的 信息 包含 在 实体 PropertyForRent 中 ， 而 管理 房产 的 员工 的 信息 包含 在 实体 
Staff 中 。 这 种 情况 下 ， 我们 可 以 通过 联系 Staff Manages PropertyForRent 来 生成 需要 
的 列表 。 
使 用 事务 路 径 

第 二 步 是 针对 所 需 的 事务 验证 概念 模型 ， 验 证 方法 是 在 ER 图 中 直接 标 出 每 个 事务 所 有 
的 路 径 。 图 16-9 给 出 了 附录 A 中 列 出 的 用 户 视 图 StaffClient 的 查询 事务 的 一 个 例子 。 很 显 
R, 事务 越 多 ， 该 图 就 越 复杂 ， 因 此 为 了 可 读 性 ,我 们 需要 多 张 图 来 描述 所 有 的 事务 。 

采用 这 种 方法 ,设计 人 员 就 能 形象 地 表示 出 模型 中 与 某 事务 相关 和 不 相关 的 部 分 ， 因 
此 就 能 够 很 直观 地 看 到 数据 模型 对 所 需 事务 的 支持 情况 。 如 果 模 型 中 有 些 部 分 不 被 任何 事 
务 使 用 ， 我 们 就 要 质疑 这 部 分 信息 在 数据 模型 中 存在 的 意义 了 。 男 一 方面 ， 如 果 模 型 中 某 
些 部 分 不 足以 为 某 个 事务 提供 正确 的 路 径 ， 我 们 就 要 检查 是 否 遗 漏 了 关键 的 实体 KRR 
者 属性 。 
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使 用 这 种 方法 检查 视图 是 否 支 持 每 个 事务 ， 看 起 来 很 复杂 ， 事 实 也 如 此 。 那 么 有 些 人 就 
可 能 省 略 这 个 步骤 。 然 而 在 这 个 时 候 就 进行 这 样 的 检查 很 重要 ， 如 果 推 迟到 以 后 再 做 ， 一 
发 现 数据 模型 中 的 任何 错误 ， 解决 起 来 难度 更 大 ， 代 价 更 高 。 





wos E: 
sr fe kesten e 
(d) 
tele (f) (m) 
Go 
‘a (h), (i) 







(c), (g) 
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viewDate Holds States 
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图 16-9 使 用 路 径 方法 检验 概念 数据 模型 对 用 户 事务 的 支持 
步骤 1.9 与 用 户 一 起 复查 概念 数据 模型 
| 目标 | 和 用 户 一 起 复查 概念 数据 模型 以 确保 该 模型 真实 地 描述 了 企 事业 单位 的 数据 需求 。 


在 步骤 1 完成 之 前 ， 我 们 和 用 户 一 起 复查 概念 数据 模型 。 概 念 数据 模型 包括 ER EA 
述 数据 模型 的 支持 文档 。 如 果 数 据 模型 中 存在 任何 问题 ,我 们 必须 进行 适当 的 修改 ， 这 可 能 
需要 重复 前 面 的 步骤 。 这 个 过 程 可 能 需要 重复 多 次 ， 直 到 用 户 确认 该 模型 确实 “真实 地 ” 表 
现 了 被 建 模 的 那 部 分 企 事业 单位 需求 。 

附录 D 总 结 了 本 方法 的 这 些 步骤 。 下 一 章 讲述 逻辑 数据 库 设 计 方法 学 的 详细 步骤 。 


本 章 小 结 

e 设计 方法 学 是 一 种 结构 化 的 方法 ， 它 用 过 程 、 技 术 、 工 具 和 文档 等 辅助 手段 来 支持 和 简化 设计 
过 程 。 

e 数据 库 设计 包括 三 个 主要 阶段 : 概念 数据 库 设 计 、 逻 辑 数 据 库 设计 和 物理 数据 库 设 计 。 

e 概念 数据 库 设计 是 为 企 事业 单位 使 用 的 数据 构建 模型 的 过 程 ， 独 立 于 所 有 物理 上 的 考虑 。 

e 概念 数据 库 设 计 始 于 企 事 业 单 位 概念 数据 模型 的 创建 ， 该 数据 模型 完全 独立 于 有 关 实 现 的 细节 ， 如 
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目标 DBMS 、 应 用 程序 、 编 程 语言 、 硬 件 平台 、 人 性 能 问题 或 其 他 物理 因素 等 。 

© 逻辑 数据 库 设 计 是 基于 一 个 特定 的 数据 模型 (比如 关系 模型 ) 创建 一 个 企 事业 单位 使 用 的 数据 模型 
的 过 程 ， 但 独立 于 特定 的 DBMS 和 其 他 物理 上 的 考虑 。 逻 辑 数据 库 设 计 将 概念 数据 模型 转换 成 企 
事业 单位 的 逻辑 数据 模型 。 

e 物理 数据 库 设 计 是 在 二 级 存储 器 上 实现 数据 库 的 过 程 ， 它 描述 基础 关系 、 文 件 组 织 ， 用 于 高 效 访问 
数据 的 索引 以 及 相关 的 完整 性 约束 和 安全 机 制 。 

© 物理 数据 库 设 计 阶 段 允许 设计 人 员 决 定 怎样 实现 数据 库 。 因此 ， 物 理 设计 的 实现 要 依赖 于 特定 的 
DBMS。 在 物理 与 概念 /逻辑 设计 之 间 会 有 反馈 ， 因 为 在 物理 设计 中 为 了 提高 性 能 而 采用 的 措施 可 
能 会 影响 概念 / 逻辑 数据 模型 的 结构 s 

© 成 功 设计 数据 库 的 关键 的 因素 包括 : 尽 可 能 多 地 与 用 户 交互 式 工作 以 及 必要 时 愿意 重复 各 个 步骤 等 。 

e 方法 学 的 步骤 1 的 目的 是 建立 一 个 满足 企 事 业 单位 数据 需求 的 概念 数据 模型 。 概 念 数据 模型 包括 : 
实体 类 型 、 联 系 类 型 、 属 性 、 属 性 域 、 主 关键 字 和 可 替换 关键 字 。 

o 概念 数据 模型 需要 文档 支持 ， 如 在 设计 模型 的 整个 过 程 中 逐步 产生 的 ER 图 和 数据 字典 。 

需要 验证 概念 数据 模型 以 确保 它 文 持 所 需要 的 事务 。 确 保 概念 数据 模型 支持 所 需要 的 事务 的 两 个 步 

TRE: (1) 用 文档 写 出 每 个 事务 的 需求 ， 检 查 模型 中 是 否 提供 了 每 个 事务 需要 的 所 有 信息 《实体 、 联 

系 和 它们 的 属性 ); (2 ) 直接 在 ER 图 上 标 出 表示 每 个 事务 的 路 径 。 


思考 题 


16.1 描述 设计 方法 学 的 目的 。 

16.2 ”描述 数据 库 设计 包含 的 主要 阶段 。 

16.3 ”指出 成 功 设计 数据 库 的 重要 因素 。 

16.4 讨论 在 数据 库 设 计 过 程 中 用 户 扮演 的 重要 角色 。 

16.5 ”描述 概念 数据 库 设计 的 主要 目的 。 

16.6 ”指出 与 概念 数据 库 设计 相关 的 主要 步 又 。 

16.7 ”如何 从 用 户 需 求 规格 说 明 书 中 确定 实体 和 联系 类 型 ? 

16.8 ”如 何 从 用 户 需求 规格 说 明 书 中 确定 属性 ， 并 将 属性 和 实体 或 者 联系 类 型 关联 ? 
16.9 ”描述 特殊 化 / 泛 化 实体 类 型 的 目的 ， 并 讨论 在 概念 数据 库 设 计 中 为 什么 这 一 步 是 可 选 的 。 
16.10 ”如何 检查 数据 模型 中 的 元 余 ， 举 例 说 明 。 

16.11 讨论 为 什么 要 验证 概念 数据 模型 ， 并 描述 验证 概念 模型 的 两 种 方法 。 

16.12 指出 并 描述 概念 数据 库 设计 过 程 中 产生 的 文档 的 用 途 。 


习题 

DreamHome 案例 研究 

16.13 ”为 附录 A 中 描述 的 DreamHome 的 用 户 视图 Branch 建立 一 个 概念 数据 模型 。 把 你 的 ER 图 和 
13-8 相 比 较 ， 说明 不 同 之 处 。 

16.14 证明 你 的 概念 数据 模型 支持 附录 A 中 列举 的 DreamHome 的 用 户 视图 Branch 的 所 有 查询 事务 。 

University Accommodation Office 案例 研究 

16.15 ”给 出 附录 B.1 中 描述 的 University Accommodation Office 案例 的 用 户 需求 规格 说 明 书 。 

16.16 为 该 案例 创建 概念 数据 模型 ， 并 说 明 为 支持 设计 而 做 的 假设 。 验 证 概念 数据 模型 对 所 需 事 务 的 
支持 。 
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EasyDrive School of Motoring 案例 研究 

16.17 给 出 附录 B.2 中 描述 的 EasyDrive School of Motoring 案例 的 用 户 需 求 规格 说 明 书 。 

16.18 ”为 该 案例 创建 概念 数据 模型 ， 并 说 明 为 支持 设计 而 做 的 假设 。 验 证 概念 数据 模型 对 所 需 事务 的 
支持 。 

Wellmeadows Hospital 案例 研究 

16.19 ”确定 附录 B.3 中 描述 的 Wellmeadows Hospital 案例 中 的 用 户 视 图 Medical Director 和 Charge Nurse. 

16.20 ”为 每 个 用 户 视 图 提供 用 户 需 求 规格 说 明 书 。 

16.21 为 每 个 用 户 视图 创建 概念 数据 模型 ， 并 说 明 为 支持 设计 而 做 的 假设 。 
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方法 学 一 一 关系 模型 的 逻辑 数据 库 设计 





本 章 我 们 主要 学 习 : 

© 如 何 从 概念 数据 模型 中 导出 一 组 关系 

o 如 何 使 用 规范 化 技术 验证 这 些 关 系 

o 如 何 验证 逻辑 数据 模型 以 确保 它 支 持 所 需 的 事务 

© 如 何 将 基于 一 个 或 多 个 用 户 视图 的 局 部 敢 辑 数据 模型 合并 为 反映 所 有 用 户 视图 的 企 
事业 单位 的 全 局 逻辑 数据 模型 

e 如 何 保证 最 终 的 全 局 逻辑 数据 模型 真实 且 准 确 地 反映 企 事业 单位 的 数据 需求 


第 10 章 我 们 讨论 了 数据 库 系统 开发 生命 周期 的 主要 阶段 ， 其 中 一 个 主要 阶段 是 数据 库 
设计 。 数 据 库 设 计 阶 段 又 包括 了 三 个 子 阶段 : 概念 数据 库 设计 、 逻 辑 数据 库 设 计 和 物理 数据 
库 设 计 。 上 一 章 我 们 引入 了 方法 学 的 概念 ， 并 讲述 了 数据 库 设 计 的 三 个 子 阶段 所 包含 的 具体 
步 又， 并 讨论 了 其 中 的 步骤 1， 即 概念 数据 库 设 计 。 

本 章 我 们 继续 讨论 方法 学 中 的 步骤 2， 将 步骤 1 中 生成 的 概念 模型 转换 成 逻辑 数据 模型 。 

本 书 给 出 的 逻辑 数据 库 设 计 方 法 学 包含 了 一 个 可 选 的 步骤 2.6， 即 当 数 据 库 拥有 多 个 用 
户 视 图 且 采 用 集成 的 方法 来 处 理 它们 时 (参见 10.5 节 )， 步 骤 2.6 才 是 必需 的 。 在 这 种 情况 
下 ， 我 们 需要 重复 步骤 1 到 步骤 2.5 以 创建 所 需 的 足够 多 的 局 部 逻辑 数据 模型 ， 然 后 在 步骤 
2.6 再 将 它们 合并 形成 一 个 全 局 逻辑 数据 模型 。 一 个 局 部 逻辑 数据 模型 反映 了 一 个 或 者 多 个 
(但 不 是 所 有 ) 用 户 视 图 的 数据 需求 ， 全 局 逻辑 数据 模型 则 反映 了 所 有 用 户 视 图 的 数据 需求 
(参见 10.5 节 )。 在 步骤 2.6 之 后 ， 我 们 不 再 使 用 术语 “全 局 逻辑 数据 模型 ”， 而 只 是 简单 地 
将 最 终 模 型 称 为 “逻辑 数据 模型 " 。 逻 辑 数 据 库 设计 阶段 的 最 后 一 步 则 是 考虑 该 模型 对 数据 
库 系 统 未 来 开发 需求 的 支持 度 。 

步骤 2 创建 的 逻辑 数据 模型 是 物理 数据 库 设 计 的 起 点 ， 物 理 数 据 库 设计 将 在 第 18 章 和 
第 19 章 中 的 步骤 3 到 步骤 8 中 讨论 。 在 整个 方法 学 的 描述 中 ， 我 们 在 语义 明确 的 时 候 都 使 
用 术语 “实体 ”和 “联系 ”替代 “实体 类 型 ”和 “联系 类 型 ",， “类 型 ”二 字 只 有 在 需要 避免 
上 收 义 的 时 候 才 会 使 用 。 


17.1 关系 模型 的 逻辑 数据 库 设计 方法 学 
本 节 讲述 关系 模型 的 逻辑 数据 库 设计 方法 的 步骤。 
步骤 2 建立 逻辑 数据 模型 


目标 | 将 概念 数据 模型 转换 为 远 辑 数据 模型 ， 并 对 该 模型 的 结构 正确 性 以 及 是 否 能 够 支持 
企 事 业 单位 需要 处 理 的 事务 进行 验证 。 
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这 一 步 的 主要 目的 是 将 步骤 1 中 创建 的 概念 数据 模型 转换 成 满足 企 事 业 单 位 数据 需求 的 
.逻辑 数据 模型 ， 具 体 步骤 为 : 

步骤 2.1 从 逻辑 数据 模型 中 导出 关系 

步骤 2.2 使 用 规范 化 方法 验证 关系 

步骤 2.3 针对 用 户 事务 验证 关系 

步骤 2.4 ”检查 完整 性 约束 

步骤 2.5 与 用 户 一 起 复查 逻辑 数据 模型 

步骤 2.6 将 避 辑 数据 模型 合并 为 全 局 模型 (可 选 步骤 ) 

步骤 2.7 检查 模型 对 未 来 可 扩展 性 的 支持 

首先 我 们 要 从 步骤 1 创建 的 概念 数据 模型 中 导出 一 组 关系 (关系 模式 )。 关 系 模式 的 结 
构 需 要 用 规范 化 的 方法 进行 验证 ， 然 后 还 要 检查 这 些 关 系 是 否 一 定 能 够 支持 用 户 需 求 规格 说 
明 书 中 列 出 的 事务 。 接 下 来 ， 检查 逻辑 数据 模型 是 否 包含 了 所 有 重要 的 完整 性 约束 。 男 外 ， 
我 们 还 要 和 用 户 一 起 复查 逻辑 数据 模型 ， 直 到 用 户 认 可 该 模型 确实 能 够 真实 地 反映 企 事业 单 
位 的 数据 需求 。 

方法 学 的 步骤 2 既 适 用 于 简单 数据 库 系统 的 设计 ， 也 适用 于 复杂 的 数据 库 系 统 。 例 如 ， 
如 果 只 需要 创建 一 个 单 用 户 视 图 的 数据 库 ， 或 者 使 用 视图 集中 方法 (参见 10.5 节 ) 创建 多 用 
户 视图 的 数据 库 ， 则 这 两 种 情况 均 属 简单 数据 库 系统 的 设计 。 此 时 可 应 用 步骤 2 创建 其 逻辑 
数据 模型 ， 但 需 省 去 步骤 2.6。 如 果 要 创建 的 数据 库 具 有 多 个 用 户 视 图 ， 并 需要 使 用 视图 集 
成 的 方法 处 理 多 用 户 视 图 (参见 10.5 节 )， 则 需要 反复 执行 步骤 2.1 到 步骤 2.5 的 操作 ， 以 获 
得 若干 个 数据 模型 ， 这 些 数据 模型 分 别 表 示 数 据 库 系统 中 不 同 的 用 户 视图 。 在 步骤 2.6 再 将 
这 些 数据 模型 合并 为 一 个 全 局 逻辑 数据 模型 。 

步骤 2 (可 能 包含 步骤 2.6， 也 可 能 不 包含 ) 的 最 后 是 对 逻辑 数据 模型 的 评估 ， 以 确保 
模型 支持 系统 未 来 可 能 的 进一步 的 开发 。 步 又 2 结束 后 ， 我 们 将 得 到 一 个 正确 的 、 容 易 理 解 
的 、 准 确 地 反映 了 企 事业 单位 数据 需求 的 逻辑 数据 模型 。 

我 们 使 用 基于 上 一 章 的 DreamHome 案例 研究 的 Staff 用 户 视图 创建 的 概念 数据 模型 来 
说 明 步 又 2， 图 17-1 给 出 了 它 的 ER 图 。 我 们 也 使 用 DreamHome 案例 研究 的 Branch 用 户 视 
图 (图 13-8 给 出 了 它 的 ER Al) 来 说 明 一 些 Staff 用 户 视 图 中 没有 涉及 的 概念 ， 并 且 在 步 
DR 2.6 中 演示 如 何 将 这 些 数 据 模型 合并 。 


步 又 2.1 从 多 辑 数据 模型 中 导出 关系 
| 目标 | 为 人 逻辑 数据 模型 创建 关系 ， 用 来 表示 已 确定 的 实体 、 联 系 和 属性 。 


在 步骤 2.1 中 ， 将 为 逻辑 数据 模型 导出 关系 以 表示 实体 、 联 系 和 属性 。 我 们 可 以 使 用 关 
系数 据 库 的 数据 库 定义 语言 ( DataBase Definition Language, DBDL) 描述 每 个 关系 的 组 成 。 
使 用 DBDL 时 ， 我 们 需要 首先 指定 关系 的 名 字 以 及 被 括号 括 起 来 的 关系 的 简单 属性 列表 。 
然后 ， 指 定 关 系 的 主 关键 字 、 可 替换 关键 字 或 外 部 关键 字 。 在 外 部 关键 字 后 面 要 给 出 所 引用 
的 主 关键 字 的 关系 。 也 要 列 出 所 有 导出 属性 及 其 计算 方法 。 

实体 与 实体 之 间 的 联系 通过 主 关键 字 / 外 部 关键 字 机 制 表示 。 要 确定 在 什么 地 方 该 使 用 
外 部 关键 字 ， 必 须 先 确认 联系 中 包含 的 “ 父 ” 实 体 和 “ 子 ” 实 体 。 父 实体 是 指 这 样 的 实体 ， 
它 的 主 关 键 字 的 副本 被 放 入 表示 子 实体 的 关系 中 ， 作 为 该 关系 的 外 部 关键 字 。 

现在 我 们 讨论 如 何 为 下 列 结构 导出 与 之 对 应 的 关系 ， 这 些 结构 都 有 可 能 出 现在 概念 数据 
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Supervisor 


Supervises <7 {Optional} 
v 
Staff 


Registers > 
















staffNo {PK} 
name 
fName 
IName 
position 
sex 
DOB 


clientNo {PK} 
name 
fName 
IName 
telNo 
eMail 


M 









4 
Owns 
Holds States 
, vy Yy 
AssociatedWith 
1..1 y 
ownerNo {PK} leaseNo {PK} prefType 
address paymentMethod maxRent 
telNo depositPaid 
rentStart 
EA {Mandatory, Or} rentFinish 
/deposit 


/duration 


PrivateOwner BusinessOwner 


name bName 
fName bType 
IName contactName 


图 17-1 列 出 了 所 有 属性 的 StaffClient 用 户 视图 的 概念 数据 模型 


模型 中 : 
(1) 强 实体 类 型 
(2) 弱 实 体 类 型 
(3) 一 对 多 (1: *) 二 元 联系 类 型 
(4) 一 对 一 (1:1) 二 元 联系 类 型 
(5) 一 对 一 (1 : 1 ) 递归 联系 类 型 
(6) EX / 子 类 联系 类 型 
(7) 多 对 多 (* : *) 二 元 联系 类 型 
(8) 复杂 联系 类 型 
(9) 多 值 属 性 
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在 下 面 讨 论 的 大 多 数 例 子 中 ， 我 们 都 使 用 DreamHome 的 用 户 视图 StaffClient 的 概念 数 
据 模型 ， 图 17-1 给 出 了 它 的 ER 图。 
(1) 强 实 体 类 型 

对 于 数据 模型 中 每 个 强 实体 ， 创 建 一 个 包含 这 个 实体 所 有 简单 属性 的 关系 。 对 于 组 合 属 
性 ， 比 如 name， 仅 将 主要 的 简单 属性 包含 进 关 系 ， 如 fName 和 1Name。 例 如 ， 图 17-1 中 
Staff 关系 的 组 成 为 : 


Staff (staffNo, fName, IName, position, sex, DOB) 

主 关 键 字 staffNo 
(2) BERRA 

对 于 数据 模型 中 的 每 个 弱 实 体 ， 创 建 一 个 包含 该 实体 所 有 简单 属性 的 关系 。 弱 实体 的 部 
分 主 关 键 字 甚至 全 部 都 是 从 所 有 者 实体 中 获取 的 ， 因 此 弱 实 体 关 键 字 的 确认 要 等 与 所 有 者 实 
体 相关 的 联系 全 部 都 转换 完毕 后 才能 进行 。 例 如 ， 图 17-1 中 的 弱 实 体 Preference 起 初 被 转 
换 为 关系 Preference: 

Preference (prefType, maxRent) 

主 关键 字 无 (目前 为 止 ) 

在 这 种 情况 下 ， 关 系 Preference 的 主 关 键 字 还 无 法 确定 ， 要 等 到 联系 States 被 正确 地 转 
换 完 毕 后 才能 确认 。 
(3) 一 对 多 (1:*) 二 元 联系 类 型 

对 于 每 个 一 对 多 的 二 元 联系 ， 联 系 “ 一 方 ” 的 实体 被 标记 为 父 实体 ， 联 系 “ 多 方 ” 的 实 
体 被 标记 为 子 实体 。 为 了 描述 这 种 联系 ,我 们 要 将 父 实体 的 主 关 键 字 属性 的 副本 放 到 对 应 于 
子 实体 的 关系 中 ， 作 为 该 关系 的 外 部 关键 字 。 

例如 ， 在 图 17-1 中 的 联系 Staff Registers Client 是 一 个 1:* 的 联系 ， 即 一 个 员工 负责 为 
多 个 客户 注册 。 在 该 例 中 ，Staff 是 “一 方 "， 表示 父 实体 ，Client 为 “多 方 "， 表 示 子 实体 。 
这 些 实 体 间 联系 的 建立 方式 是 : 将 Staff ( 父 ) 实体 的 主 关键 字 staffNo 的 副本 放 到 Client (F) 
关系 中 。Staff Al Client 的 结构 为 : 


将 staffNo 插 入 Client 中 ， 表示 出 Registers 联 系 


Staff (staffNo, fName, IName, position, sex, DOB) Client (clientNo, fName, IName, telNo, eMail, staffNo) 
主 关 键 字 staffNo 主 关键 字 clientNo 
WRK BF eMail 


外 部 关键 字 staffNo references Staff(staffNo) 

此 外 ， 如 果 一 个 1:* 的 联系 本 身 还 拥有 一 个 或 者 多 个 属性 ， 则 这 些 属 性 也 应 该 和 主 
关键 字 一 起 放 到 子 实体 的 关系 中 。 例 如 ， 如 果 联 系 Staff Registers Client 本 身 还 有 属性 
dateRegister， 表 示 一 个 员工 注册 某 客户 的 时 间 ， 则 这 个 属性 也 应 该 和 关系 Sta 任 的 主 关键 字 
staffNo 一 起 放 到 关系 Client 中 。 

(4) 一 对 一 (1:1) 二 元 联系 类 型 

创建 一 个 表示 1 : 1 联系 的 关系 的 过 程 稍稍 复杂 一 点 ， 因 为 基数 已 经 无 法 再 帮助 我 们 区 
分 谁 是 父 实体 、 谁 是 子 实体 了 。 这 时 ,我 们 可 以 在 参与 约束 (参见 12.6.5 节 ) 的 帮助 下 决定 
最 好 应 该 如 何 表示 这 种 联系 : 是 将 两 个 实体 合并 到 一 个 关系 中 ， 还 是 创建 两 个 关系 ,并 将 一 
个 关系 的 主 关键 字 复 制 到 另外 一 个 关系 中 。 接 下 来 我 们 要 考虑 的 是 应 该 怎样 用 关系 表示 下 列 
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参与 约束 : 

e 双方 都 强制 参与 的 1:1 联系 

e 一 方 强制 参与 的 1:1 联系 

e 双方 都 可 选 参 与 的 1:1 联系 

(a) 双方 都 强制 参与 的 1:1 联系 。 在 这 种 情况 下 ， 应 该 将 联系 中 的 两 个 实体 合并 到 一 个 
关系 里 ， 并 选择 原 实 体 的 一 个 主 关键 字 作 为 新 关系 的 主 关键 字 ， 其 他 的 (如果 有 的 话 ) 作为 
可 替换 关键 字 。 

联系 Client States Preference 是 一 个 双方 都 强制 参与 的 1 :1 联系 。 所 以 我 们 将 这 两 个 关 
系 合并 ,得 到 下 面 的 关系 Client: 

Client (clientNo, fName, IName, telNo, eMail, prefType, maxRent, staffNo) 

主 关键 字 clientNo 


可 替换 关键 字 eMail 
外 部 关键 字 staffNo 引 用 Staff(staffNo) 


如 果 双 方 都 强制 参与 的 1:1 联系 本 身 还 有 一 个 或 多 个 属性 ， 那 么 这 些 属性 也 应 该 包含 
在 合并 以 后 的 关系 中 。 例 如 ， 如 果 联 系 States 还 有 一 个 用 来 记录 日 期 的 属性 dateStated， 那 
么 在 合并 以 后 的 Client 关系 中 也 应 该 包含 这 个 属性 。 

注意 ， 仅 当 这 两 个 实体 间 没 有 其 他 直接 联系 (这 种 联系 会 妨碍 合并 ， 比 如 1: * RA) 时 
才能 将 两 个 实体 合并 为 一 个 关系 。 和 否则， 就 要 用 主 关键 字 / 外 部 关键 字 机 制 表 示 联 系 States。 
我 们 将 在 (c) 中 简要 讨论 在 这 种 情形 下 如 何 指定 父 实体 和 子 实体 。 

(b) 一 方 强制 参与 的 1:1 联系 。 这 种 情况 下 可 以 使 用 参与 约束 来 标识 1:1 联系 的 父 实 
体 和 子 实体 。 联 系 中 可 选 参与 的 实体 被 指定 为 父 实体 ， 在 联系 中 强制 参与 的 实体 被 指定 为 子 
实体 。 如 上 所 述 ， 我 们 要 把 父 实体 的 主 关 键 字 的 副本 放 到 表示 子 实体 的 关系 中 。 如 果 这 个 联 
系 本 身 还 有 一 个 或 多 个 属性 ， 则 这 些 属性 也 应 该 放 到 子 实体 中 。 

例如 ， 如 果 在 1:1 联系 Client States Preference 中 ，Client 是 部 分 参与 ( 换 句 话说 ,不 
是 每 个 Client 都 指定 了 Preference)， 则 指定 实体 Client 为 父 实体 ， 而 实体 Preference 为 子 实 
Æ. K, Client (£) 实体 的 主 关键 字 的 副本 (BP clientNo) 将 被 放 到 Preference (F) 关系 
中 ， 如 : 


对 于 Client 为 可 选 方 的 1:1 联 系 ， 应 将 ClientNo 插 入 
Preference， 表 示 出 States 联 系 


Client (clientNo, fName, IName, telNo, eMail, staffNo) Preference (clientNo, preffype, maxRent) 
E KR F clientNo 主 关 键 字 clientNo 
可 替换 关键 字 eMail 外 部 关键 字 clientNo 引用 Client(clientNo) 


外 部 关键 字 staffNo 引用 Staff(staffNo) 


注意 关系 Preference 的 外 部 关键 字 属 性 也 是 Preference 的 主 关 键 字 。 在 这 种 情况 下 ， 要 
等 到 外 部 关键 字 从 关系 Client 复制 到 关系 Preference 以 后 ， 才 能 最 后 确认 关系 Preference 的 
主 关键 字 是 什么 。 因 此 ， 在 步骤 的 最 后 ， 应 该 标识 出 在 这 个 转换 过 程 中 形成 的 所 有 新 的 主 关 
键 字 或 者 候选 关键 字 ， 并 对 数据 字典 做 相应 的 更 新 。 

(c) 双方 都 可 选 参与 的 1:1 联系 。 在 这 种 情况 下 ， 我们 可 以 随意 地 指定 父 实体 和 子 实 
体 。 否 则 如 果 能 够 找到 更 多 的 与 该 联系 相关 的 信息 ， 就 可 以 帮助 我 们 判断 谁 是 父 实体 、 谁 
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是 子 实体 。 

例如 ， 考 虑 双方 均 为 可 选 参与 的 1 : 1 的 联系 Staff Uses Car。( 注 意 稍 后 讨论 的 结果 也 适 
用 于 下 面 这 种 情形 : 尽管 1 : 1 联系 的 双方 都 是 强制 参与 的 ,但 又 不 能 将 它们 组 合 到 一 个 关 
RE.) 如 果 没 有 其 他 信息 帮助 我 们 确定 父 实体 和 子 实体 ， 那 么 就 可 以 随意 选择 。 换 句 话 说 ， 
我 们 可 以 将 实体 Staff 的 主 关 键 字 的 副本 放 到 实体 Car 里 ， 反 之 亦 然 。 

但 是 ， 若 假设 大 多 数 但 不 是 全 部 汽车 可 被 员工 使 用 ， 但 只 有 少数 员工 使 用 汽车 。 实 体 
Car 尽管 是 可 选 参与 的 ， 但 相 比 实体 Staff 来 说 要 强制 一 些 。 因 此 我 们 可 以 指定 Staff 为 父 实 
体 ，Car 为 子 实体 ， 并 将 实体 Staff 的 主 关键 字 (staffNo) 的 副本 放 到 关系 Car 中 。 

(5 ) 一 对 一 (1:1) 递归 联系 类 型 

对 于 1 :1 的 递归 联系 ,同样 遵循 前 面 已 经 讨论 的 1:1 联 系 的 各 种 参与 规则 。 然 而 对 
于 这 种 特殊 的 1 :1 联系 ,参与 联系 的 双方 是 同一 个 实体 。 对 于 双方 都 是 强制 参与 的 1:1 递 
归 联 系 ， 我 们 可 以 用 一 个 关系 表示 ， 只 不 过 这 个 关系 中 存在 两 个 主 关键 字 的 副本 。 和 前 面 
一 样 ， 其 中 一 个 主 关键 字 的 副本 是 外 部 关键 字 ， 并 且 要 被 重 命名 以 说 明 它 所 代表 的 联系 的 
含义 。 

对 于 一 方 强制 参与 的 1:1 递归 联系 ， 既 可 以 像 前 面 讲 的 那样 ， 创 建 一 个 包含 了 两 个 主 
关键 字 副 本 的 关系 ,也 可 以 再 创建 一 个 新 的 关系 单独 表示 这 种 联系 。 这 个 新 的 关系 应 该 只 有 
两 个 属性 ， 两 个 都 是 主 关 键 字 的 副本 。 和 前 面 一 样 ， 主 关键 字 的 副本 都 将 作为 外 部 关键 字 存 
在 ， 并 且 要 重新 命名 以 阐明 它们 在 关系 中 的 意义 。 

对 于 双方 都 为 可 选 参与 的 1 : 1 递归 联系 ， 可 以 像 前 面 一 样 创建 一 个 新 关系 来 表示 它 。 
(6) 超 类 / 子 类 联系 类 型 

对 于 概念 数据 模型 中 的 每 个 超 类 / 子 类 联系 ， 将 超 类 实体 作为 父 实 体 ， 子 类 实体 作为 子 
实体 。 如 何 表 示 这 种 联系 ”有 几 种 不 同 的 选择 : 可 以 用 一 个 关系 表示 ， 也 可 以 用 多 个 关系 表 
示 。 有 很 多 因素 可 以 帮助 我 们 做 出 正确 的 选择 ， 比 如 超 类 / 子 类 联系 的 不 相交 性 和 参与 约束 
(参见 13.1.6 节 )、 子 类 是 否 与 不 同 的 联系 有 关 、 超 类 / 子 类 联系 中 参与 者 的 数量 等 。 表 17-1 
给 出 了 仅 基 于 参与 约束 和 不 相交 约束 表示 超 类 / 子 类 联系 的 方法 。 


表 17-1 基于 参与 约束 和 不 相交 约束 表示 超 类 / 子 类 联系 的 方法 


参与 约束 不 相交 约束 所 需 关 系 
强制 非 不 相交 {And} 一 个 关系 (具有 一 个 或 者 多 个 鉴别 子 以 区 分 各 元 组 的 类 型 ) 


两 个 关系 :一 个 关系 表示 超 类 ， 所 有 子 类 用 一 个 关系 (具有 一 个 或 多 个 
Mie | PARADE {And} | 鉴别 子 以 区 分 各 元 组 的 类 型 ) 表示 


强制 不 相交 {Or} 多 个 关系 : 每 一 对 超 类 / 子 类 转化 为 一 个 关系 


可 选 不 相交 {Or} 多 个 关系 : 一 个 关系 表示 超 类 ， 每 个 子 类 各 用 一 个 关系 表示 


例如 ， 考 虑 图 17-1 中 给 出 的 Owner EX / 子 类 联系 。 从 表 17-1 中 可 以 看 出 ， 我 们 有 多 
种 方法 将 这 种 联系 转化 为 一 个 或 多 个 关系 ， 如 图 17-2 所 示 。 选 择 的 范围 很 广 ， 我 们 可 以 将 
所 有 属性 都 放 到 同一 个 关系 中 ， 并 使 用 两 个 鉴别 子 pOwnerFlag 和 bOwnerFlag 说 明 元 组 是 
否 属于 某 一 个 特定 子 类 (选择 1)， 也 可 以 将 这 些 属性 划分 到 三 个 关系 中 (选择 4)。 此 时 ， 
对 超 类 / 子 类 联系 最 恰当 的 描述 取决 于 联系 上 的 约束 。 从 图 17-1 中 可 以 看 出 ， 超 类 Owner 
及 其 子 类 的 联系 是 强制 和 不 相交 的 ， 因 为 超 类 Owner 的 每 个 成 员 必 须 是 某 个 子 类 的 成 员 
( PrivateOwner 或 BusinessOwner)， 但 是 不 能 同时 属于 两 个 子 类 。 因 此 我 们 将 选择 3 作为 这 
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种 联系 的 最 佳 描述 ， 为 每 个 子 类 创建 一 个 单独 的 关系 ， 并 在 每 个 子 类 中 都 包含 了 超 类 的 主 关 
键 字 的 副本 。 
选择 1- 强 制 、 非 不 相交 
AllOwner (ownerNo, address, telNo, fName, IName, bName, bType, contactName, pOwnerFlag, 


bOwnerFlag) 
主 关键 字 ownerNo 


选择 2- 可 选 、 非 不 相交 


Owner (ownerNo, address, telNo) 


主 关键 字 ownerNo 


OwnerDetails (ownerNo, fName IName, bName, bType, contactName, pOwnerFlag, bOwnerFlag) 
主 关键 字 ownerNo 
外 部 关键 字 ownerNo 引 用 Owner(ownerNo) 


选择 3- 强 制 、 不 相交 
PrivateOwner (ownerNo, fName, IName, address, telNo) 
主 关键 字 ownerNo 


BusinessOwner (ownerNo, bName, bType, contactName, address, telNo) 


主 关键 字 ownerNo 

选择 4- 可 选 、 不 相交 
Owner (ownerNo, address, telNo) 
主 关键 字 ownerNo 


PrivateOwner (ownerNo, fName, IName) 
主 关键 字 ownerNo 
外 部 关键 字 ownerNo 引用 Owner(ownerNo) 


BusinessOwner (ownerNo, bName, bType, contactName) 
主 关 键 字 ownerNo 
外 部 关键 字 ownerNo 引用 Owner(ownerNo) 


17-2 基于 表 17-1 中 显示 的 参与 约束 和 不 相交 约束 来 表示 Owner 超 类 / 子 类 联系 的 各 种 方法 


必须 强调 的 是 表 17-1 给 出 的 仅仅 是 一 个 参考 ， 可 能 会 有 其 他 因素 影响 最 终 的 选择 。 
例如 ， 对 于 选择 1 (强制 、 非 不 相交 )， 我 们 使 用 两 个 鉴别 子 标识 元 组 是 否 是 某 个 特定 子 
类 的 成 员 。 一 种 等 效 的 方法 是 可 以 用 一 个 鉴别 子 区 分 元 组 是 PrivateOwner 的 成 员 还 是 
BusinessOwner 的 成 员 ， 或 者 两 者 都 是 。 甚 至 可 以 不 要 鉴别 子 ， 简 单 地 对 专属 于 某 个 子 类 的 
一 个 属性 进行 测试 ， 通 过 测试 该 属性 的 值 ， 就 可 以 判断 这 个 元 组 是 否 为 那个 子 类 的 成 员 。 在 
这 种 情况 下 ， 必 须 保 证 被 检测 的 属性 就 是 可 以 对 元 组 进行 区 分 的 属性 (因此 必须 非 空 )。 

在 图 17-1 中 ， 在 Staff 和 Supervisor 之 间 有 另外 一 种 可 选 参与 的 超 类 / 子 类 联系 。 因 为 
超 类 Sta 任 只 有 一 个 子 类 ( Supervisor)， 所 以 没有 不 相交 约束 。 这 种 情况 下 ， 因 为 “被 主管 
管理 的 员工 ”要 比 “ 主 管 ” 多 ， 所 以 我 们 将 这 种 联系 表示 成 一 个 单 关 系 : 


Staff (staffNo, fName, IName, position, sex, DOB, supervisorStaffNo) 
主 关键 字 staffNo 
外 部 关键 字 supervisorStaffNo 引用 Staff(staffNo) 


如 果 我 们 把 这 个 超 类 / 子 类 联系 像 图 17-5 中 那样 表示 为 一 个 一 对 多 的 联系 ， 两 方 都 是 
可 选 参与 ， 得 到 的 结果 和 前 面 表示 的 一 样 。 
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(7) 多 对 多 (*:*) 二 元 联系 类 型 

为 每 个 * :*# 二 元 联系 创建 一 个 关系 ， 关 系 中 包含 了 * : * 二 元 联系 的 所 有 属性 以 及 参与 
这 个 联系 的 实体 的 主 关键 字 属 性 的 副本 ， 主 关键 字 属 性 的 副本 作为 外 部 关键 字 。 这 些 外 部 关 
键 字 可 能 直接 构成 新 关系 的 主 关键 字 ， 也 可 能 与 联系 自身 的 某 些 属 性 组 合 在 一 起 构成 新 关系 
的 主 关 键 字 。( 如 果 联 系 自 身 的 一 个 或 者 多 个 属性 具有 唯一 性 ， 尽 管 本 转换 方法 可 以 解决 这 
个 问题 ， 但 还 是 说 明 我 们 在 建立 概念 数据 模型 时 漏 掉 了 一 个 实体 。) 

例如 ， 考 虑 图 17-1 中 的 多 对 多 联系 Client Views PropertyForRent。 联 系 Views 有 两 个 属 
性 : dateView 和 comments。 为 了 表示 这 个 联系 ， 我 们 首先 将 强 实体 Client 和 PropertyForRent 
转化 为 关系 ， 然 后 创建 关系 Viewing 来 表示 联系 Views: 


Client (clientNo, fName, IName, telNo, eMail, 
preffype, maxRent, staffNo) 


XH F clientNo PropertyForRent (propertyNo, street, city, 
可 替换 关键 字 eMail postcode, type, rooms, rent) 
外 部 关键 字 staffNo 引用 Staff(staffNo) 主 关 键 字 propertyNo 


Viewing (clientNo, propertyNo, dateView, comment) 

主 关键 字 clientNo, propertyNo 

外 部 关键 字 clientNo 引用 Client(clientNo) 

外 部 关键 字 propertyNo 引用 PropertyForRent(propertyNo) 


(8) 复杂 联系 类 型 

为 每 一 个 复杂 联系 都 创建 一 个 关系 ， 该 关系 包含 了 属于 这 个 联系 的 所 有 属性 ， 并 将 参 
与 该 联系 的 实体 的 主 关键 字 属 性 也 复制 到 这 个 关系 中 ， 作 为 关系 的 外 部 关键 字 。 表 示 联 系 的 
“多 ” 方 (如 1..*，0..*) 的 外 部 关键 字 通 向 也 会 成 为 这 个 新 创建 的 关系 的 主 关键 字 ， 也 可 能 
与 联系 的 其 他 一 些 属性 共同 构成 主 关 键 字 。 

例如 ， 图 13-8 给 出 的 用 户 视 图 Branch 中 的 三 元 联系 Registers Registers 表示 某 位 员工 
在 某 分 公司 新 注册 了 一 位 客户 ， 即 Registers 表示 员工 、 分 公司 和 客户 三 者 间 的 关联 。 为 了 
表示 这 种 关联 ， 我 们 可 以 为 强 实体 Branch Staff 和 Client 分 别 创建 一 个 关系 ， 并 创建 关系 
Registration 表示 联系 Registers: 


Staff (staffNo, fName, IName, position, sex, DOB, supervisorStaffNo) 
ERR F staffNo 
外 部 关键 字 supervisorStaffNo 引用 Staff(staffNo) 


Branch (branchNo, street, city, postcode) 


主 关键 字 branchNo 


Client (clientNo, fName, IName, telNo, eMail, prefType, maxRent) 


+X ® F clientNo i 
可 替换 关键 字 eMail | 


Registration (clientNo, branchNo, staffNo, dateJoined) 
+ % # 7 clientNo, branchNo 

外 部 关键 字 branchNo 引用 Branch(branchNo) 

外 部 关键 字 clientNo 引用 Client(clientNo) 

外 部 关键 字 staffNo 引用 Staff(staffNo) 


注意 ， 联 系 Registers 在 图 17-1 中 作为 一 个 二 元 联系 ， 这 与 它 在 图 17-3 中 的 构成 形式 
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是 一 致 的 。 至 于 Registers 在 DreamHome 的 StaffClient 用 户 视 图 中 (作为 一 个 二 元 联系 ) 和 
Branch 用 户 视 图 中 (作为 一 个 复杂 三 元 联系 ) 的 差别 以 及 如 何 解决 将 在 步骤 2.6 中 讨论 。 


Staff (staffNo, fName, IName, position, sex, DOB, PrivateOwner (ownerNo, fName, IName, address, telNo) 
supervisorStaffNo) 主 关键 字 ownerNo 

主 关键 字 staffNo ~ 

外 部 关键 字 supervisorStaffNo 4| A] Staff(staffNo) 


BusinessOwner (owrierNo, bName, bType, Client (clientNo, fName, IName, teiNo, eMail, prefType, 
contactName, address, telNo) maxRent, staffNo) 


主 关键 字 ownerNo 主 关键 字 ciientNo 
可 替换 关键 字 bName 可 替换 关键 字 eMall 
可 替换 关键 字 telNo 外 部 关键 字 staffNo 引用 Staff(staffNo) 


PropertyForRent (propertyNo, street, city, postcode, Viewing (clientNo, propertyNo, dateView, comment) 
type, rooms, rent, ownerNo, staffNo) 主 关键 字 clientNo, propertyNo 
主 关键 字 propertyNo 外 部 关键 字 clientNo 引用 Client(clientNo) 


外 部 关键 字 ownerNo 引用 PrivateOwner(ownerNo) and 外 部 关键 字 propertyNo 引用 PropertyForRent(propertyNo) 


BusinessOwner(ownerNo) 


外 部 关键 字 staffNo 引用 Staff(staffNo) 


Lease (leaseNo, paymentMethod, depositPaid, rentStart, 
rentFinish, clientNo, propertyNo) 


主 关 键 字 leaseNo 

可 替换 关键 字 propertyNo, rentStart 

可 替换 关键 字 clientNo, rentStart 

外 部 关键 字 clientNo 引用 Client(clientNo) 

外 部 关键 字 propertyNo 引用 PropertyForRent(propertyNo) 
导出 deposit (PropertyForRent.rent*2) 

导出 duration (rentFinish — rentStart) 





图 17-3 DreamHome 的 用 户 视 图 StaffClient 的 关系 


(9) 多 值 属性 

对 于 实体 中 的 每 一 个 多 值 属性 ， 都 创建 一 个 新 的 关系 来 表示 这 个 多 值 属性 ， 并 上 且 将 实体 
的 主 关键 字 也 复制 到 新 建立 的 关系 中 ， 作 为 新 关系 的 外 部 关键 字 。 除 非 多 值 属 性 本 身 是 实体 
的 可 替换 关键 字 ， 否 则 新 关系 的 主 关 键 字 就 是 多 值 属 性 和 实体 的 主 关键 字 的 组 合 。 

例如 ， 在 用 户 视 图 Branch 中 ， 每 个 分 公司 都 有 多 达 三 个 电话 号 码 ， 因 此 实体 Branch 的 
属性 telNo 就 被 定义 为 多 值 属性 ， 如 图 13-8 所 示 。 为 了 表示 多 值 属性 ， 我 们 为 实体 Branch 
创建 了 一 个 关系 ， 另 外 创建 了 一 个 关系 Telephone 表示 多 值 属 性 telNo: 


将 branchNo 插 入 Telephone 
Branch (branchNo, street, city, postcode) Telephone (telNo, branchNo) 
主 关键 字 branchNo 主 关 键 字 telNo 


外 部 关键 字 branchNo 引 用 Branch(branchNo) 
表 17-2 总 结 了 如 何 将 实体 和 联系 转化 为 关系 。 
表 17-2 将 实体 和 联系 转化 为 关系 小 结 
实体 /联系 转化 方法 
强 实体 创建 包含 所 有 简单 属性 的 关系 


弱 实体 创建 包含 所 有 简单 属性 的 关系 〈 主 关键 字 要 等 到 该 弱 实 体 与 每 一 个 父 实体 的 联系 
转化 完成 后 才能 确定 ) 


BAITS BDEF——KARAWHPRREFRIF 375 


(2) 
实体 /联系 转化 方法 
将 “一 方 ”实体 的 主 关键 字 作 为 表示 “多 方 ”实体 的 关系 的 外 部 关键 字 ， 该 联系 


Bee: 的 所 有 属性 也 都 放 到 表示 “多 方 ”实体 的 关系 中 
1:1 二 元 联系 
(a) 双方 都 为 强制 参与 | 将 两 个 实体 组 合 起 来 ， 用 一 个 关系 表示 
(b) 一 方 强制 参与 将 “可 选 ” 方 实体 的 主 关键 字 作 为 表示 “强制 ” 方 实体 的 关系 的 外 部 关键 字 


如 果 没 有 其 他 信息 帮助 我 们 确定 父 实体 和 子 实体 ， 那 么 就 可 以 随意 选择 ， 即 可 以 
将 任意 一 个 实体 的 主 关 键 字 作为 与 男 外 一 个 实体 相对 应 的 关系 的 外 部 关键 字 


HX / 子 类 联系 参见 表 17-1 


创建 一 个 关系 表示 此 类 联系 ， 该 关系 包含 了 联系 本 身 的 所 有 属性 ， 并 将 参与 该 联 
系 的 所 有 实体 的 主 关 键 字 也 复制 到 关系 中 ， 作 为 外 部 关键 字 


多 值 属性 oo Ee de 
部 关键 字 

用 文档 记录 关系 和 外 部 关键 字 属性 

在 步骤 2.1 的 最 后 ,使 用 DBDL 将 从 逮 辑 数据 模型 导出 的 关系 记录 在 文档 中 。 图 17-3 
给 出 了 DreamHome 的 StaffClient 用 户 视 图 的 所 有 关系 。 

现在 ， 每 一 个 关系 都 包含 了 所 有 应 该 包含 的 属性 ， 接 下 来 就 该 确定 这 些 关 系 的 主 关键 
字 和 可 替换 关键 字 了 。 这 一 步 对 于 弱 实 体 尤 其 重要 ， 因 为 弱 实 体 的 主 关 键 字 是 依赖 于 父 实体 
(可 能 有 多 个 父 实体 ) 的 ， 即 将 父 实体 的 主 关 键 字 复制 过 来 构成 自己 的 主 关 键 字 。 例 如 ， 纶 
实体 Viewing 的 主 关键 字 就 是 由 实体 PropertyForRent 的 主 关键 字 的 副本 ( propertyNo) 和 实 
体 Client 的 主 关键 字 的 副本 (clientNo) 组 合 而 成 的 。 

可 以 扩展 DBDL 语法 来 表示 外 部 关键 字 的 完整 性 约束 (步骤 2.5 )。 数 据 字典 也 要 更 
新 ， 以 记录 本 步骤 所 确定 的 所 有 新 的 主 关 键 字 和 可 替换 关键 字 。 例 如 ， 复制 了 其 他 关系 的 
主 关 键 字 以 后 ， 关 系 Lease 又 得 到 了 两 个 新 的 可 替换 关键 字 ， 分别 为 属性 集 ( propertyNo， 
rentStart) 和 (clientNo，rentStart ) 。 


步骤 2.2 ”使 用 规范 化 方法 验证 关系 
| 目标 | 使 用 规范 化 方法 验证 逻辑 数据 模型 的 关系 。 


在 前 一 个 步骤 中 ， 我 们 导出 了 一 组 关系 来 表示 步骤 1 中 创建 的 概念 数据 模型 。 这 一 步 ， 
我 们 用 规范 化 的 规则 对 每 个 关系 中 的 属性 集合 进行 验证 。 规 范 化 的 目的 是 确保 这 组 关系 在 拥 
有 最 小 属性 集合 的 同时 ， 又 足以 支撑 企 事业 单位 的 数据 需求 。 而 且 ， 这 些 关 系 还 应 该 具有 最 
小 的 数据 元 余 ， 以 避免 14.3 节 中 讨论 的 更 新 异常 情况 。 但 是 ， 有 些 匈 余 是 为 了 允许 关系 之 
间 进 行 连接 操作 而 存在 的 ， 因 此 是 必要 的 元 余 。 

运用 规范 化 方法 之 前 ， 首 先 要 确定 每 个 关系 的 属性 之 间 的 函数 依赖 。 我 们 在 14.4 PE 
经 讨论 了 规范 化 方法 要 用 到 的 函数 依赖 的 特性 ， 并 且 知 道 只 有 在 明确 了 每 个 属性 的 含义 之 后 
才能 确定 函数 依赖 。 孔 数 依赖 是 一 个 关系 内 属性 之 间 的 重要 联系 。 规 范 化 过 程 要 用 到 的 是 关 
系 的 函数 依赖 和 主 关键 字 。 

规范 化 方法 采取 一 系列 步骤 对 关系 进行 查验 ， 以 确认 其 属性 是 否 遵循 某 个 给 定 的 范 
式 ， 如 第 一 范式 (1NF)、 第 二 范式 (2NF) 或 者 第 三 范式 (3NF)。 这 些 范式 的 规则 已 经 在 


(c) 双方 都 为 可 选 参与 


+*+ 一 元 联系 、 复 杂 联 系 
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14.6 ~ 14.8 节 详 细 地 讨论 过 了 。 为 了 避免 由 于 数据 宛 余 而 引起 的 问题 ， 建 议 每 个 关系 至 少 
是 3NF 的 。 

按照 前 面 讲述 的 从 概念 数据 模型 导出 关系 的 过 程 去 做 的 话 ， 我 们 得 到 的 关系 应 该 已 经 是 
3NF 的 。 如 果 发 现 某 个 关系 不 是 3NFE， 则 说 明 逻 辑 数据 模型 或 概念 数据 模型 中 存在 错误 ， 或 
者 我 们 在 从 概念 数据 模型 中 导出 关系 的 过 程 中 出 现 了 错误 。 如 果 有 必要 ， 我 们 要 重建 这 些 错 
误 的 关系 或 者 数据 模型 ， 以 确保 它们 能 够 真实 地 反映 企 事 业 单位 的 数据 需求 。 

曾经 有 这 样 的 观点 ， 规 范 化 的 数据 库 设 计 不 能 够 提供 最 高 的 处 理 效率 。 在 此 提出 下 列 观 
点 以 供 人 参考: 

o 规范 化 设计 就 是 按照 函数 依赖 组 织 数 据 。 因此， 这 个 过 程 处 于 概念 设计 和 物理 设计 
Zl] . 
WAR AEB TT ERT TK Be WR PE OY AE SY PPE 
和 含义 的 最 佳 理解 。 如 果 有 特别 的 性 能 指标 ， 物 理 设计 可 以 不 同 。 一 种 可 能 是 将 一 
些 规范 化 关系 做 非 规 范 化 处 理 。 物 理 数据 库 设计 方法 的 步骤 7 将 详细 讨论 这 种 方法 
(参见 第 19 章 )。 
规范 化 设计 和 鲁 棒 性 更 强 ， 不 存在 14.3 节 讨 论 的 更 新 异常 问题 。 
e 现在 的 计算 机 比 几 年 前 要 强大 得 多 。 有 些 时 候 ， 在 实现 中 用 额外 的 性 能 成 本 来 换取 
易 用 性 可 能 更 好 一 些 。 
要 使 用 规范 化 ， 数 据 库 设计 人 员 必 须 完 全 理解 数据 库 中 的 每 个 属性 。 这 种 好 处 可 能 
是 最 重要 的 。 

e 规范 化 可 以 得 到 灵活 的 数据 库 设 计 ， 并 且 很 容易 扩展 。 
步骤 2.3 针对 用 户 事务 验证 关系 | 


| 目标 | 确保 逻辑 数据 模型 中 的 关系 支持 所 需 的 事务 。 


步骤 2.3 的 目的 是 验证 逻辑 数据 模型 ， 确 保 该 逻辑 数据 模型 能 够 支持 用 户 需 求 规格 说 明 
书 中 描述 的 企 事 业 单位 所 需 的 事务 。 步 骤 1.8 执行 过 这 种 检查 ， 以 确保 概念 数据 模型 能 够 文 
持 所 需 的 事务 。 本 步骤 检查 上 一 步 创 建 的 关系 是 否 也 支持 所 需 的 事务 ， 并 且 确 保 创建 关系 的 
过 程 没有 错误 。 

利用 关系 、 关 系 的 主 关键 字 / 外 部 关键 字 、ER 图 和 数据 字典 ， 我 们 可 以 尝试 以 手工 的 
方式 来 执行 企 事业 单位 的 业务 。 如 果 能 用 这 种 方法 解决 所 有 事务 ， 就 说 明 逻 辑 数 据 模型 能 够 
支持 所 需 的 事务 。 反 之 ， 如 果 某 一 事务 不 能 手工 完成 ， 则 说 明 数 据 模 型 中 一 定 存 在 问题 ， 而 
且 必 须 解 决 。 出 现 这 种 情况 的 原因 很 可 能 是 在 创建 关系 时 出 现 了 错误 ， 应 该 返回 去 检查 事务 
所 涉及 的 那 部 分 数据 模型 ， 解 决 存在 的 问题 。 


步骤 2.4 检查 完整 性 约束 
| 目标 | 检查 逻辑 数据 模型 中 的 完整 性 约束 。 


完整 性 约束 是 为 了 避免 数据 库 的 不 完全 、 不 准确 、 不 一 致 而 增加 的 约束 。 虽 然 最 后 选用 
H DBMS 可 能 并 不 一 定 支 持 所 设计 的 完整 性 约束 ， 但 这 不 是 关键 。 这 个 阶段 只 关心 高 层 的 
设计 ， 也 就 是 说 ， 首 先 弄 清楚 需要 什么 样 的 完整 性 约束 ， 而 不 急于 考虑 怎样 实现 它们 。 包 含 
了 所 有 重要 的 完整 性 约束 的 逻辑 数据 模型 才 是 企 事业 单 位 数据 需求 的 “真实 ”写照 。 考 虑 下 
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必须 有 值 的 数据 约束 
属性 域 约束 
多 重 性 约束 

实体 完整 性 约束 
引用 完整 性 约束 

e 一 般 性 约束 
必须 有 值 的 数据 约束 

某 些 属性 必须 总 需要 一 个 有 效 值 ， 也 就 是 说 ， 它 们 不 允许 为 空 。 例 如 ， 每 位 员工 必须 
有 一 个 相关 的 工作 职位 (如 主管 或 者 助理 )。 这 些 属 性 一 旦 被 记录 在 数据 字典 中 (步骤 1.3), 
就 表明 已 经 确认 了 这 些 约束 的 存在 。 
属性 域 约束 

每 个 属性 都 有 一 个 域 ， 即 一 组 合法 的 值 。 例 如 ， 员工 的 性 别 要 么 是 “M” 要 么 是 “F” 
因此 sex 属性 的 域 就 由 单字 符 “M” 和 “F” 组 成 。 在 为 数据 模型 确定 属性 域 时 ， 这 些 约束 
应 该 已 经 被 确认 (步骤 1.4 )。 

多 重 性 约束 

多 重 性 是 定义 在 数据 库 中 数据 之 间 的 联系 上 的 约束 。 例 如 描述 一 个 部 门 有 很 多 员工 ， 而 
一 个 员工 只 能 在 一 个 部 门 工 作 的 情况 。 企 事业 单位 数据 建 模 的 一 个 重要 部 分 是 确保 描述 了 所 
有 适当 的 完整 性 约束 。 在 步骤 1.2 中 ,我 们 定义 了 实体 之 间 的 联系 ， 这 一 步 将 定义 和 记录 所 
有 可 以 这 样 描述 的 完整 性 约束 。 
实体 完整 性 约束 

实体 的 主 关键 字 不 能 为 空 。 例 如 ， 关 系 Staff 的 每 个 元 组 的 主 关 键 字 属 性 staffNo 必须 有 
一 个 值 。 在 为 每 个 实体 类 型 确认 主 关 键 字 时 ， 就 应 该 已 经 考虑 过 这 些 约束 了 (步骤 1.5 )。 
引用 完整 性 约束 

子 关系 中 的 每 个 元 组 都 通过 外 部 关键 字 链 接 到 父 关系 中 拥有 相同 键 值 的 元 组 。 引 用 完整 
性 是 指 ， 如 果 外 部 关键 字 包 含 一 个 值 ， 这 个 值 就 必须 指向 父 关 系 中 存在 的 一 个 元 组 。 例 如 ， 
考虑 联系 Staff Manages PropertyForRent。 关 系 PropertyForRent 中 的 属性 staffNo 将 待 租 的 
房产 链接 到 关系 Staff 中 管理 该 房产 的 员工 。 如 果 staffNo 不 为 空 ， 则 它 必然 包含 一 个 有 效 的 
值 ， 而 且 是 关系 Staff 的 属性 staffNo 上 存在 的 一 个 值 ， 否 则 就 可 能 将 房产 分 配给 一 个 不 存在 
的 员工 。 

对 于 外 部 关键 字 ， 有 两 个 问题 必须 考虑 。 第 一 个 问题 是 外 部 关键 字 是 否 人 允许 为 空 。 例 
如 ， 是 否 允 许 存 储 一 个 房产 的 详细 描述 而 没有 指定 一 个 员工 去 管理 它 (也 就 是 说 ， 能 指定 
staffNo HZU)? 这 个 问题 不 是 员工 是 否 存 在 ， 而 是 是 否 必 须 指派 一 名 员工 管理 房产 。 一 
般 而 言 ， 对 于 联系 中 的 子 关系 : 

e 如 果 是 强制 参与 的 ， 则 不 允许 为 空 。 

e 如 果 是 可 选 参 与 的 ， 则 人 允许 为 空 。 

第 二 个 问题 是 如 何 保 证 引用 完整 性 。 为 了 实现 这 一 点 ， 我们 可 以 指定 存在 约束 ， 存 在 
约束 定义 一 个 候选 关键 字 或 者 外 部 关键 字 可 以 插入 、 更 新 或 删除 的 条 件 。 对 于 1:* 的 联系 
Staff Manages PropertyForRent， 考 虑 下 面 的 情况 。 

情况 1: 在 子 关 系 (PropertyForRent) 中 插入 元 组 。 为 确保 引用 完整 性 ， 检 查 新 插入 的 
PropertyForRent 元 组 的 外 部 关键 字 属 性 staffNo, 或 者 为 空 ， 或 者 设置 为 现存 的 Staff 元 组 中 
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已 有 的 值 。 

情况 2: 从 子 关系 (PropertyForRent) 中 删除 元 组 。 删 除 子 关 系 的 一 个 元 组 不 会 影响 引 
用 完整 性 。 

情况 3 : 更 新 子 关 系 (PropertyForRent) 的 元 组 的 外 部 关键 字 。 类 似 于 情况 1。 为 了 确 
保 引 用 完整 性 ， 检 查 更 新 的 PropertyForRent 元 组 的 属性 staffNo， 或 者 为 空 ， 或 者 设置 为 现 
存 Sta 任 元 组 中 已 有 的 值 。 

情况 4 : 在 父 关 系 (Staff) HEATH, MERK (Staff) 中 插入 一 个 元 组 不 会 影响 引 
用 完整 性 ， 它 仅仅 是 没有 引用 (F) 元 组 的 ( 父 ) 元 组 ， 即 不 管理 任何 房产 的 一 名 员工 。 

情况 5 : 从 父 关系 (Staff) 中 删除 元 组 。 如 果 删 除 父 关系 的 一 个 元 组 ， 并 且 存 在 一 个 子 
元 组 引用 了 要 被 删除 的 父 元 组 ， 那 么 就 破坏 了 引用 完整 性 。 也 就 是 说 ， 删 除了 管理 着 一 处 或 
多 处 房产 的 员工 。 对 这 种 情况 ， 可 以 考虑 下 面 几 种 策略 : 

e NO ACTION : 如 果 有 子 元 组 引用 ， 则 禁止 在 父 关 系 中 删除 该 父 元 组 。 在 这 里 就 是 ， 

“如 果 一 个 员工 当前 管理 着 房产 ， 就 不 能 删除 他 ”。 

e CASCADE: 在 删除 父 元 组 时 ， 自 动 删除 任何 引用 它 的 子 元 组 。 如 果 被 删除 的 子 元 组 
在 男 外 一 个 联系 中 作为 父 元 组 ， 那么 这 种 删除 操作 应 该 作用 到 它 的 子 关 系 的 元 组 上 ， 
依 此 类 推 。 也 就 是 说 ， 父 关系 的 删除 操作 延伸 到 了 子 关系 。 在 这 里 就 是 ,“ 如 果 删 除 
一 名 员工 ， 就 自动 删除 他 管理 的 所 有 房产 ” 。 显 然 在 这 种 情况 下 和 采用 这 种 策略 是 不 明 
智 的 。 当 使 用 组 合 这 种 增强 建 模 技 术 关 联 父 实 体 和 子 实体 时 ， 经 党 采用 CASCADE 
策略 (参见 13.3 节 )。 
SET NULL: 删除 一 个 父 元 组 时 ， 将 所 有 与 被 删除 元 组 关联 的 子 元 组 中 的 外 部 关键 字 
的 值 自动 设 为 室 。 在 这 里 就 是 ,“ 如 果 删 除 某 位 员工 ， 则 将 当前 分 配给 他 管理 的 那些 
房产 的 管理 者 设置 为 未 知 ”。 如 果 外 部 关键 字 的 属性 可 以 为 空 ， 我 们 就 得 考虑 使 用 这 
种 策略 。 
SET DEFAULT : 删除 一 个 父 元 组 时 ,将 所 有 与 被 删除 元 组 关联 的 子 元 组 中 的 外 部 关 
键 字 的 值 自动 设 为 它们 的 默认 值 。 在 这 里 就 是 ,“ 如 果 删 除 某 位 员工 ， 则 将 当前 分 配 
给 他 管理 的 房产 指定 由 另外 一 名 (默认 ) 员工 (比如 经 理 ) 负责 管理 ”。 如 果 为 外 部 
关键 字 的 属性 定义 了 默认 值 ， 我 们 就 得 考虑 使 用 这 种 策略 。 

e NO CHECK: 删除 一 个 父 元 组 时 ， 不 会 为 维持 引用 完整 性 而 做 任何 处 理 。 

情况 6 : 更 新 父 元 组 (Staff) 中 的 主 关键 字 。 在 更 新 父 关系 元 组 的 主 关 键 字 值 的 时 候 ， 
如 果 有 一 个 子 元 组 引用 了 原 主 关 键 字 的 值 ， 即 如 果 要 更 新 某 员工 的 主 关 键 字 的 值 ， 而 该 员 
工 目前 仍 管理 着 一 处 或 多 处 房产 ， 则 此 次 更 新 操作 破坏 了 引用 完整 性 。 这 种 情况 可 以 使 用 
前 面 的 策略 来 保证 引用 完整 性 。 如 果 使 用 CASCADE， 父 元 组 的 主 关键 字 的 更 新 就 会 影响 
到 任何 引用 它 的 子 元 组 ， 如 果 一 个 引用 子 元 组 本 身 又 是 主 关 键 字 、 父 元 组 ， 则 此 次 更 新 还 
将 级 联 到 引用 这 个 子 元 组 的 子 元 组 ， 依 此 类 推 。 对 于 更 新 操作 ， 通 常会 指定 为 CASCADE 
Fi xX 

图 17-4 给 出 了 为 DreamHome 的 StaffClient 用 户 视 图 创建 的 关系 上 的 引用 完整 性 约束 。 
一 般 性 约束 

最 后 我 们 考虑 一 般 性 约束 。 更 新 实体 的 操作 可 能 受到 完整 性 约束 的 制约 ， 这 些 约束 来 目 
更 新 操作 所 代表 的 事务 对 “现实 世界 ”的 管控 。 例 如 ，DreamHome 就 有 条 规则 : 一 名 员工 
不 能 同时 管理 多 于 100 处 房产 。 
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Staff (staffNo, fName, {Name, position, sex, DOB, supervisorStaffNo) 
主 关键 字 staffNo 
外 部 关键 字 supervisorStaffNo 引用 Staff(staffNo) ON UPDATE CASCADE ON DELETE SET NULL 


Client (clientNo, fName, IName, telNo, eMail, preffype, maxRent, staffNo) 

主 关键 字 clientNo 

可 替换 关键 字 eMail 

外 部 关键 字 staffNo 引用 Staff(staffNo) ON UPDATE CASCADE ON DELETE NO ACTION 


PropertyForRent (propertyNo, street, city, postcode, type, rooms, rent, ownerNo, staffNo) 
主 关键 字 propertyNo 
外 部 关键 字 ownerNo 引用 PrivateOwner(ownerNo) and BusinessOwner(ownerNo) 
ON UPDATE CASCADE ON DELETE NO ACTION 
外 部 关键 字 staffNo 引用 Staff(staffNo) ON UPDATE CASCADE ON DELETE SET NULL 


Viewing (clientNo, propertyNo, dateView, comment) 
主 关键 字 clientNo, propertyNo 
外 部 关键 字 clientNo 引 用 Client(clientNo) ON UPDATE CASCADE ON DELETE NO ACTION 
外 部 关键 字 propertyNo 引用 PropertyForRent(propertyNo) 
ON UPDATE CASCADE ON DELETE CASCADE 
Lease (leaseNo, paymentMethod, depositPaid, rentStart, rentFinish, clientNo, propertyNo) 
主 关键 字 leaseNo 
可 替换 关键 字 propertyNo, rentStart 
可 替换 关键 字 clientNo, rentStart 
外 部 关键 字 clientNo 引用 Client(clientNo) ON UPDATE CASCADE ON DELETE NO ACTION 


外 部 关键 字 propertyNo 引 用 PropertyForRent(propertyNo) 
ON UPDATE CASCADE ON DELETE NO ACTION 





图 17-4 DreamHome 的 StaffClient 用 户 视图 的 关系 上 的 引用 完整 性 约束 


用 文档 记录 所 有 完整 性 约束 
为 物理 数据 库 设 计 考虑 ， 在 数据 字典 中 应 记录 下 所 有 的 完整 性 约束 。 


步骤 2.5 与 用 户 一 起 复查 远 辑 数据 模型 


目标 | 和 用 户 一 起 复查 逻辑 数据 模型 ， 确 保 用 户 能 够 认可 ， 即 该 模型 真实 地 表示 了 企 事业 
现在 ,逻辑 数据 模型 应 该 已 经 设计 完毕 并 且 全 部 文档 化 了 。 然 而 ， 为 了 确认 我 们 的 工 
作 ， 还 需要 和 用 户 一 起 复查 逻辑 数据 模型 ， 并 确保 用 户 认可 该 模型 ， 使 得 用 户 也 认为 该 模型 
能 够 真实 地 表示 企 事 业 单位 的 数据 需求 。 如 果 用 户 对 模型 不 满意 ， 我 们 就 需要 重复 前 面 的 一 
些 步骤 ， 对 模型 进行 修改 。 
如 果 用 户 满意 ， 则 下 一 步 工 作 (特别 是 采用 什么 方法 处 理 用 户 视 图 ) 主要 依赖 于 数据 库 
的 用 户 视 图 的 个 数 。 如 果 数 据 库 系统 只 有 一 个 用 户 视图 ,或 者 即使 有 多 个 用 户 视图 但 是 只 需 
要 使 用 视图 集中 的 方法 进行 处 理 (参见 10.5 节 ) 的 话 , 我 们 就 直接 进入 步骤 2 的 最 后 一 步 ， 
BAER 2.7。 如 果 数 据 库 有 多 个 用 户 视图 ， 而 且 需 要 使 用 视图 集成 的 方法 处 理 (参见 10.5 
节 )， 则 执行 步骤 2.6。 视 图 集成 方法 的 结果 是 建立 多 个 逻辑 数据 模型 ， 每 个 逻辑 数据 模型 表 
示 数 据 库 的 一 个 或 者 多 个 (但 不 是 全 部 ) 用 户 视图 。 步 又 2.6 的 目标 就 是 合并 这 些 逻 辑 数据 
模型 ， 创 建 一 个 表示 数据 库 全 部 用 户 视图 的 逻辑 数据 模型 。 在 讨论 这 个 步骤 之 前 ， 我 们 简单 
讨论 一 下 逻辑 数据 模型 和 数据 流 图 之 间 的 关系 。 
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逻辑 数据 模型 和 数据 流 图 的 关系 

逻辑 数据 模型 反映 了 企 事 业 单位 需要 存储 的 数据 的 结构 。 数 据 流 图 ( Data Flow Diagram, 
DFD) 显示 了 数据 在 企 事业 单位 的 流动 情况 和 存储 情况 。 如 果 企 事业 单位 拥有 某 属 性 ， 则 该 
属性 就 必须 出 现在 某 个 实体 类 型 中 ， 并 且 可 能 以 数据 流 的 形式 在 企 事业 单位 的 事务 中 流动 。 
当 我 们 使 用 这 两 种 技术 根据 用 户 的 需求 规格 说 明 书 建 模 时 ， 可 以 用 其 中 一 个 来 检查 男 一 个 的 
一 致 性 和 完整 性 。 两 种 技术 之 间 的 关联 规则 是 : 

© 数据 存储 结构 应 该 描述 所 有 的 实体 类 型 。 

© 数据 流 中 出 现 的 属性 应 该 属于 某 个 实体 类 型 。 


步骤 2.6 将 远 辑 数据 模型 合并 为 全 局 模型 (可 选 步 又 ) 
| 目标 | 将 局 部 逻辑 数据 模型 合并 为 表示 数据 库 所 有 用 户 视图 的 全 局 逻辑 数据 模型 。 


只 有 在 数据 库 拥有 多 个 用 户 视图 ， 并 且 使 用 视图 集成 的 方法 处 理 这 些 模式 时 ， 本 步骤 才 
是 必需 的 。 为 了 方便 合并 过 程 的 描述 ,我 们 使 用 术语 “局 部 逻辑 数据 模型 ”和 “全 局 逻辑 数 
据 模 型 ”"。 局 部 逻辑 数据 模型 表示 数据 库 的 一 个 或 者 多 个 (但 不 是 全 部 ) APRA, Fez 
辑 数据 模型 则 表示 数据 库 所 有 的 用 户 视 图 。 在 步骤 2.6 中 ， 我们 将 两 个 或 者 多 个 局 部 逻辑 数 
据 模型 合并 为 一 个 全 局 逻辑 数据 模型 。 

本 步骤 的 数据 来 源 是 通过 方法 学 的 步骤 1 以 及 步骤 2.1 一 2.5 创建 的 局 部 数据 模型 。 当 
然 ， 每 个 局 部 逻辑 数据 模型 必须 是 正确 的 、 易 理解 的 和 无 歧义 的 ， 每 个 模型 只 表示 数据 库 的 
一 个 或 者 多 个 (但 不 是 全 部 ) 用 户 视图 。 也 就 是 说 ， 每 个 模型 只 表示 整个 数据 库 的 一 部 分 。 
因此 当 我 们 将 所 有 的 用 户 视 图 看 作 一 个 整体 时 ， 就 有 可 能 出 现 不 一 致 或 者 重 又 的 现象 。 所 
以 ， 当 我 们 将 局 部 逻辑 数据 模型 合并 为 全 局 逻辑 数据 模型 时 ， 要 致力 于 解决 视图 之 间 可 能 存 
FE HY) ES A Be |] 

合并 完成 后 ， 还 需要 使 用 类 似 于 验证 局 部 数据 模型 的 方法 来 对 全 局 逻辑 数据 模型 进行 验 
证 。 验 证 过 程 要 重点 针对 在 合并 过 程 中 变化 了 的 那 部 分 内 容 。 

步骤 2.6 的 活动 包括 : 

步骤 2.6.1 将 局 部 逻辑 数据 模型 合并 为 全 局 模型 

步骤 2.6.2 ”验证 全 局 逻辑 数据 模型 

步骤 2.6.3 与 用 户 一 起 复查 全 局 逻辑 数据 模型 

我 们 将 以 两 个 局 部 逻辑 数据 模型 为 例 逐 步 讲述 步骤 2.6 的 具体 操作 : 一 个 示例 是 为 
DreamHome 案例 研究 的 用 户 视图 StaffClient 创建 的 局 部 逻辑 数据 模型 ， 另 一 个 示例 是 第 
12 章 和 第 13 章 中 讲述 的 为 DreamHome 的 用 户 视图 Branch 创建 的 局 部 逻辑 数据 模型 。 根 据 
13-8 中 给 出 的 Branch 用 户 视图 的 ER 模型 ， 图 17-5 给 出 了 建立 的 关系 。 作 为 练习 ， 请 证 
明 这 个 转换 结果 是 正确 的 (参见 习题 17.6 )。 
步骤 2.6.1 将 局 部 逻辑 数据 模型 合并 为 全 局 模型 


| 目标 | 将 局 部 远 辑 数据 模型 合并 为 一 个 全 局 逻辑 数据 模型 。 


至 此 ， 我 们 已 经 为 每 一 个 局 部 逻辑 数据 模型 都 生成 了 ER 图 、 关 系 模式 、 数 据 字 典 以 及 
描述 模型 中 约束 的 支撑 文档 。 本 步骤 利用 这 些 信 息 确认 模型 之 间 的 相似 和 不 同 之 处 ， 并 据 此 
将 模型 合并 。 

对 于 只 有 少量 视图 并 且 每 个 视图 只 有 少量 实体 和 联系 类 型 的 简单 数据 库 系统 来 说 ， 比 较 
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Branch (branchNo, street, city, postcode, marStaffNo) 

主 关 键 字 branchNo 

可 替换 关键 字 postcode 

外 部 关键 字 mgrStaffNo 引 用 Manager(staffNo) 

Staff (staffNo, name, position, salary, supervisorStaffNo, 
branchNo) 

主 关键 字 staffNo 

外 部 关键 字 supervisorStaffNo 引用 Staff(staffNo) 

外 部 关键 字 branchNo 引用 Branch(branchNo) 


PrivateOwner (ownerNo, name, address, telNo) 


主 关键 字 ownerNo 


Telephone (telNo, branchNo) 
主 关键 字 telNo 
外 部 关键 字 branchNo 引 用 Branch(branchNo) 


Manager (staffNo, mgrStartDate, bonus) 


主 关键 字 staffNo 
外 部 关键 字 staffNo 引 用 Staff(staffNo) 


BusinessOwner (bName, bType, contactName, address, telNo) 


主 关 键 字 bName 


可 替换 关键 字 telNo 


PropertyForRent (propertyNo, street, city, postcode, type, rooms, | Client (clientNo, name, telNo, eMail, preffype, maxRent) 
rent, ownerNo, staffNo, bName, branchNo) 

主 关键 字 propertyNo 

外 部 关键 字 ownerNo 引 用 PrivateOwner(ownerNo) 


主 关键 字 clientNo 
可 替换 关键 字 eMail 


外 部 关键 字 bName 引 用 BusinessOwner(bName) 
外 部 关键 字 staffNo 4| FA Staff(staffNo) 
外 部 关键 字 branchNo 引 用 Branch(branchNo) 


Lease (leaseNo, paymentMethod, depositPaid, rentStart, 
rentFinish, clientNo, propertyNo) 

主 关键 字 leaseNo 

可 替换 关键 字 propertyNo, rentStart 

可 替换 关键 字 clientNo, rentStart 

外 部 关键 字 clientNo 引 用 Client(clientNo) 

外 部 关键 字 propertyNo 引用 PropertyForRent(propertyNo) 

导出 deposit (PropertyForRent.rent*2) 

导出 duration (rentFinish — rentStart) 


Registration (clientNo, branchNo, staffNo, dateJoined) 
+ RS clientNo, branchNo 

外 部 关键 字 clientNo 引 用 Client(clientNo) 
外 部 关键 字 branchNo 引 用 Branch(branchNo) 
外 部 关键 字 staffNo 引 用 Staff(staffNo) 


Advert (propertyNo, newspaperName, dateAdvert, cost) 

EX BEF propertyNo, newspaperName, dateAdvert 
外 部 关键 字 propertyNo 引用 PropertyForRent(propertyNo) 
外 部 关键 字 newspaperName 引用 


Newspaper(newspaperName) 


Newspaper (newspaperName, address, telNo, contactName) 
+ BEF newspaperName 
可 替换 关键 字 telNo 





图 17-5 DreamHome 的 Branch 用 户 视图 对 应 的 所 有 关系 


各 局 部 模型 、 合 并 模型 以 及 解决 模型 间 存 在 的 差异 等 工作 都 相对 比较 简单 。 但 是 对 于 大 型 
复杂 系统 ， 就 必须 采用 更 系统 化 的 方法 。 下 面 我 们 给 出 一 种 方法 ， 可 以 用 于 局 部 模型 的 合 
并 ， 并 且 能 够 解决 合并 过 程 中 发 现 的 各 种 不 一 致 的 问题 。 对 于 其 他 方法 的 讨论 ， 有 兴趣 的 
读者 可 以 查阅 Batini and Lanzerini ( 1986 )、Biskup and Convent ( 1986 ), Spaccapietra et 
al. (1992) 和 Bouguettaya et al. ( 1998 ) 的 相关 论文 。 

我 们 要 讨论 的 合并 多 个 局 部 模型 的 方法 的 典型 活动 包括 : 

(1) 复查 实体 /关系 的 名 字 、 含 义 及 其 候选 关键 字 。 

(2) 复查 联系 / 外 部 关键 字 的 名 字 和 含义 。 

(3 ) 合并 局 部 数据 模型 中 的 实体 /关系 。 

(4) 直接 包含 (不 合并 ) 各 局 部 数据 模型 所 独 有 的 实体 /关系 。 

(5 ) 合并 局 部 数据 模型 的 联系 / 外 部 关键 字 。 

(6) 直接 包含 (不 合并 ) 各 局 部 数据 模型 所 独 有 的 联系 / 外 部 关键 字 。 

(7) 查验 遗漏 的 实体 /关系 和 联系 / 外 部 关键 字 。 

(8) 查验 外 部 关键 字 。 

(9) 查验 完整 性 约束 。 

(10) 画 出 全 局 ER /关系 图 。 
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C11) 更 新 文档 。 

在 上 面 的 一 些 任务 中 ,我 们 使 用 了 术语 “实体 /关系 ”和 “联系 /外 部 关键 字 ”， 意 思 是 
设计 人 员 可 以 选择 查验 ER 模型 或 者 查验 由 ER 模型 导出 的 关系 以 及 支撑 文档 ， 或 者 两 者 都 
查验 。 基 于 关系 组 合 检查 可 能 更 容易 些 ， 因 为 由 不 同 设计 人 员 设 计 的 ER 模型 中 可 能 存在 许 
多 语法 和 语义 的 不 同 。 

合并 几 个 局 部 数据 模型 最 简单 方法 是 : 先 合 并 两 个 数据 模型 ， 得 到 一 个 新 的 模型 ， 然 后 
继续 合并 剩 下 的 局 部 数据 模型 ， 直 到 所 有 的 局 部 模型 都 被 合并 到 全 局 数据 模型 中 。 这 种 方法 
要 比 一 次 试图 同时 合并 所 有 局 部 数据 模型 要 人 简单 一 些 。 

(1) 复查 实体 /关系 的 名 字 、 含 义 及 其 候选 关键 字 

花 点 时 间 仔 细 查 看 数据 字典 ， 对 出 现在 局 部 数据 模型 中 的 实体 /关系 的 名 字 和 摘 述 进行 
查验 是 值得 的 。 当 存在 两 个 或 者 多 个 实体 /关系 时 ， 可 能 出 现 的 问题 有 : 

e 名 字 相 同 , 但 是 实际 含义 不 同 (同名 异 义 )。 

e 名 字 不 同 ， 但 是 实际 含义 相同 〈 同 义 异 名 )。 

要 想 解 决 这 些 问 题 ， 需 要 比较 每 个 实体 /关系 的 数据 内 容 。 特 别 是 利用 候选 关键 字 帮 助 
我 们 确认 那些 实际 含义 相同 、 但 是 在 不 同 的 视图 里 有 不 同名 字 的 实体 /关系 。 表 17-3 给 出 
了 DreamHome 的 用 户 视图 Branch 和 StaffClient 对 应 关系 的 比较 。 两 个 视图 中 共有 的 关系 
被 加 粗 显示 。 


表 17-3 ”用户 视图 Branch 和 StaffClient 中 的 实体 /关系 的 名 字 和 候选 关键 字 的 比较 
用 户 视图 Branch 用 户 视图 StaffClient 


实体 /关系 候选 关键 字 实体 / 关系 候选 关键 字 
Branch branchNo 
postcode 
Client clientNo Client clientNo 
eMail eMail 
PropertyForRent propertyNo PropertyForRent propertyNo 
Lease leaseNo Lease leaseNo 
propertyNo propertyNo 
rentStart rentStart 
clientNo, rentStart clientNo, rentStart 





Registration 


Newspaper 


Advert 


(clientNo, branchNo) 


newspaperName 
telNo 


(propertyNo, 
newspaperName, 
dateAdvert) 
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(2) 复查 联系 /外 部 关键 字 的 名 字 和 含义 

这 个 过 程 和 复查 实体 /关系 中 描述 的 相同 。 表 17-4 给 出 了 DreamHome 的 用 户 视 图 
Branch 和 StaffClient 中 的 外 部 关键 字 的 比较 。 两 个 视图 中 共同 的 外 部 关键 字 被 加 粗 显示 。 注 
意 两 个 视图 共同 的 关系 ，Staff 和 PropertyForRent 关系 都 有 一 个 额外 的 外 部 关键 字 branchNo。 


表 17-4 APARA Branch 和 Staff 中 外 部 关键 字 的 比较 
用 户 视 图 Branch 用 户 视 图 StaffClient 


an | sexas | zan | Fem | 外 部 关 名字 ”区 


Telephone 出 branchNo —> Branch(branchNo) 


Staff supervisorStaffNo — | Staff(staffNo) 
branchNo 一 Branch(branchNo) 
Manager staffNo 一 Staff(staffNo) 


PrivateOwner 


supervisor- Staff(staffNo) 
StaffNo 一 


FRE 

Staff 

O Soa | 

O i nome 

PropertyForRent | ownerNo 一 PrivateOwner PropertyForRent | ownerNo 一 PrivateOwner 
(ownerNo) (ownerNo) 


BusinessOwner 
(bName) 


branchNo 一 Branch(branchNo) pek aa i 
suas a ee a 


Lease clientNo 一 Client(clientNo) | Lease 
propertyNo 一 PropertyForRent 
(propertyNo) 
Registration ® | clientNo > Client(clientNo) 


branchNo 一 Branch(branchNo) debater scan’! 
staffNo 一 Staff(staffNo) Pore Pes 


BusinessOwner 


ownerNo 一 BusinessOwner 
(onwerNo) 


Staff(staffNo) 


clientNo —> Client(clientNo) 


propertyNo— | PropertyForRent 
(property No) 


clientNo 一 Client(clientNo) 


ENEE 


propertyNo —> | PropertyForRent 
(propertyNo) 


e] £ 
Z| § 
© 

| i 


Advert ® propertyNo —> PropertyForRent 
(propertyNo) 
newspaperName —> Newspaper 
(newspaperName) 


D Å Telephone 是 根据 多 值 属 性 telNo 创建 的 。 
DX Å Registration 是 根据 三 元 联系 Registers 创建 的 。 
DKA Advert 是 根据 多 对 多 (*: *) 的 联系 Advertises 创建 的 。 


通过 比较 各 视图 中 联系 的 名 字 和 外 部 关键 字 就 能 看 出 视图 的 重 释 程度 。 不 过 ， 我 们 必须 
认识 到 ， 我 们 不 能 简单 地 相信 两 个 视图 中 具有 相同 名 字 的 实体 或 者 联系 就 一 定 扮演 着 相同 的 
角色 。 尽 管 如 此 ， 在 查验 两 个 视图 是 否 存 在 重 准时， 只 要 我 们 足够 小 心 ， 从 比较 实体 /关系 
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和 联系 / 外 部 关键 字 的 名 字 开 始 仍 然 是 一 个 好 的 选择 。 

我 们 必须 小 心 处 理 那些 具有 相同 名 字 但 实际 上 表示 不 同 概 念 (也 称 为 同名 异 义 ) 的 实体 
和 联系 。 例 如 用 户 视图 StaffClient 中 的 Staff Manages PropertyForRent 和 用 户 视图 Branch 中 
的 Manager Manages Branch， 很 明显 ， 联 系 Manages 在 两 个 视图 中 分 别 表示 不 同 的 意思 。 

我 们 必须 保证 具有 相同 名 字 的 实体 或 者 联系 表示 的 是 “现实 世界 ”中 相同 的 概念 ， 并 
且 在 各 个 视图 中 不 同 的 名 字 表 示 不 同 的 概念 。 为 了 达到 这 个 目的 ， 应 比较 与 每 个 实体 相关 联 
的 属性 (特别 是 关键 字 )， 并 对 它们 和 其 他 实体 的 联系 进行 比较 。 同 时 ， 也 要 注意 这 种 情况 : 
在 一 个 用 户 视 图 中 可 能 被 提取 为 实体 或 者 联系 的 对 象 在 另外 一 个 视图 中 可 能 就 简单 地 表示 为 
某 个 实体 的 属性 了 。 例如， 实体 Branch 拥有 的 属性 managerName 在 另外 一 个 用 户 视图 中 则 
被 表示 为 实体 Manager。 
(3 ) 合并 局 部 数据 模型 中 的 实体 /关系 

检查 模型 中 要 合并 的 各 实体 /关系 的 名 字 和 含义 ， 看 看 它们 是 否 表示 相同 的 对 象 ， 以 及 
能 否 被 合并 。 这 一 步 的 典型 活动 有 : 

© 合并 名 字 相 同 并 且 主 关键 字 也 相同 的 实体 /关系 。 

© 合并 名 字 相 同 但 是 主 关键 字 不 同 的 实体 /关系 。 

© 合并 名 字 不 同 但 是 主 关键 字 相 同 或 不 同 的 实体 /关系 。 

合并 名 字 相 同 并 且 主 关键 字 也 相同 的 实体 / 关系。 通常 ， 主 关键 字 相 同 的 实体 /关系 
表示 的 “现实 世界 ”中 的 对 象 也 相同 ， 因 此 应 该 被 合并 。 合 并 以 后 的 实体 /关系 包含 了 原 
实体 /关系 中 的 所 有 属性 ， 但 是 要 去 除 重复 属性 。 例 如 ， 图 17-6 为 关系 PrivateOwner 的 属 
TE, A PrivateOwner 在 用 户 视图 Branch 和 StaffClient 中 均 有 定义 。 两 个 PrivateOwner 关 
系 的 主 关键 字 都 是 ownerNo。 我 们 通过 合并 它们 的 属性 来 合并 这 两 个 关系 ， 合 并 以 后 的 关系 
PrivateOwner 就 包含 了 原来 两 个 PrivateOwner 关系 的 所 有 属性 。 注 意 两 个 视图 在 表示 所 有 
者 的 名 字 上 存在 冲突 。 这 种 情况 下 ， 我 们 应 该 (如 果 可 能 的 话 ) 咨询 各 个 视图 的 用 户 ， 以 决 
定 最 终 应 该 如 何 表述 。 本 例 中 ， 在 合并 以 后 的 全 局 视图 中 所 有 者 的 名 字 被 分 解 为 两 个 属性 ， 
即 用 属性 fName 和 IName 表示 所 有 者 的 名 字 。 


Branch 用 户 视图 StaffClient 用 户 视 图 


PrivateOwner (ownerNo, name, address, telNo) “PrivateOwner (ownerNo, fName, IName, address, telNo) 


主 关键 字 ownerNo 主 关 键 字 ownerNo 


Global 用 户 视图 


PrivateOwner (ownerNo, fName, IName, address, telNo) 


主 关键 字 ownerNo 
图 17-6 合并 两 个 用 户 视图 Branch 和 StaffClient 中 均 有 定义 的 关系 PrivateOwner 


同样 ， 从 表 17-3 可 以 看 出 ， 两 个 视图 中 共有 的 关系 Staff、Client、PropertyForRent 和 
Lease 都 有 相同 的 主 关键 字 ， 这 些 关系 也 可 以 用 上 面 讨论 的 方法 进行 合并 。 

合并 名 字 相 同 但 是 主 关键 字 不 同 的 实体 / 关系 。 有 些 时 候 ， 我 们 会 发 现 两 个 实体 / 关系 
有 相同 的 名 字 和 相似 的 候选 关键 字 ， 但 是 主 关键 字 不 同 。 这 种 情况 下 ， 应 该 像 上 面 一 样 合 
并 这 些 实体 /关系 。 不 过 ， 还 要 选择 一 个 关键 字 作 为 主 关键 字 ， 其 他 关键 字 则 作为 可 替换 关 
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键 字 。 例 如 ， 图 17-7 列 出 了 在 两 个 视图 中 都 有 定义 的 关系 BusinessOwner 的 属性 。 用 户 视 
Branch 中 的 关系 BusinessOwner 的 主 关键 字 是 bName， 但 是 用 户 视 图 StaffClient 中 关系 
BusinessOwner 的 主 关键 字 是 ownerNo, bName 是 可 替换 关键 字 。 尽 管 主 关键 字 不 同 , 但 是 
用 户 视 图 Branch 中 BusinessOwner 的 主 关键 字 是 用 户 视图 StaffClient 中 BusinessOwner 的 
可 替换 关键 字 。 于 是 ,我 们 将 这 两 个 关系 合并 ,并 将 bName 作为 可 替换 关键 字 ， 如 图 17-7 
所 示 。 


Branch 用 户 视图 StaffClient 用 户 视图 
BusinessOwner (bName, bType, contactName, BusinessOwner (ownerNo, bName, bType, contactName, 
address, telNo) address, telNo) 
主 关 键 字 bName 主 关键 字 ownerNo 
可 替换 关键 字 telNo 可 替换 关键 字 DName 


可 替换 关键 字 telNo 


Global 用 户 视图 
BusinessOwner (ownerNo, bName, bType, contactName, address, telNo) 
主 关键 字 ownerNo 
可 替换 关键 字 bName 
可 替换 关键 字 telNo 


图 17-7 合并 主 关 键 字 不 同 的 关系 BusinessOwner 


合并 名 字 不 同 但 是 主 关键 字 相 同 或 不 同 的 实体 /关系 。 有 时 候 ， 我 们 会 发 现 两 个 实体 / 
关系 尽管 名 字 不 同 ， 但 是 所 表达 的 对 象 却 是 相同 的 。 这 些 等 同 的 实体 /关系 可 以 简单 地 通过 
下 面 的 方法 识别 : 

© 根据 名 字 判 新， 名 字 能 说 明 它 们 表达 的 对 象 是 否 相 同 。 

© 根据 含义 判断 ， 特 别 是 主 关 键 字 表达 的 意义 。 

e 根据 它们 与 某 些 联系 之 间 的 关联 判断 。 

一 个 明显 的 例子 就 是 实体 Staff 和 Employee， 如 果 发 现 它 们 是 一 对 等 同 的 实体 ， 则 合并 。 
(4) 直接 包含 (不 合并 ) 各 局 部 数据 模型 所 独 有 的 实体 /关系 

前 面 的 工作 应 该 已 经 找 出 了 所 有 相同 的 实体 /关系 。 所 有 剩 下 的 实体 /关系 都 应 该 不 加 
修改 地 直接 放 到 全 局 模型 中 。 从 表 17-3 中 可 以 看 出 ， 关 系 Branch, Telephone, Manager, 
Registration, Newspaper 和 Advert 仅 属 于 用 户 视图 Branch, KA Viewing 则 仅 属 于 用 户 视 图 
StaffClient. 
(5 ) 合并 局 部 数据 模型 的 联系 / 外 部 关键 字 

这 个 步骤 中 ， 我 们 检查 数据 模型 中 的 每 个 联系 / 外 部 关键 字 的 名 字 和 创建 目的 。 在 合并 
联系 / 外 部 关键 字 之 前 ,我 们 首先 要 解决 联系 之 间 存 在 的 冲突 ， 如 不 同 的 多 重 性 约束 等 。 本 
步骤 的 活动 包括 : 

e 合并 名 字 相 同 并 且 创 建 目 的 也 相同 的 联系 / 外 部 关键 字 。 

© 合并 名 字 不 同 但 是 创建 目的 相同 的 联系 / 外 部 关键 字 。 

根据 表 17-3 和 数据 字典 ， 我 们 可 以 找 出 名 字 相 同 且 创建 目的 也 相同 的 外 部 关键 字 ， 并 
将 它们 合并 到 全 局 模型 中 。 
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注意 两 个 视图 中 的 联系 Registers， 他 们 在 本 质 上 表示 相同 的 “事件 ”: 在 StaffClient FA 
户 视图 中 ，Registers 联系 表示 一 位 员工 注册 一 名 客户 ,通过 将 staffNo 作为 Client 关系 的 
外 部 关键 字 实 现 ; 而 在 Branch 用 户 视 图 中 ， 因 为 涉及 为 分 公司 建 模 ， 所 以 情况 稍微 复杂 一 
A, EILANNER Registration 的 关系 来 表示 某 分 公司 的 某 位 员工 为 某 位 客户 注册 这 一 情 
况 。 在 这 种 情况 下 ， 可 以 忽略 用 户 视图 StaffClient 中 的 联系 Registers， 待 到 下 一 步 ， 再 包含 
Branch 用 户 视图 中 等 价 的 联系 / 外 部 关键 字 。 
(6) 直接 包含 (不合 并) 各 局 部 数据 模型 所 独 有 的 联系 / 外 部 关键 字 

同样 ， 上 一 个 任务 已 经 找到 了 所 有 等 同 的 联系 /外 部 关键 字 (按照 定义 ， 这 些 等同 的 
联系 /外 部 关键 字 一 定 关 联 着 等 同 的 实体 /关系 ， 而 这 些 等 同 的 实体 /关系 则 应 该 已 经 被 合 
并 )。 所 有 剩余 的 联系 / 外 部 关键 字 都 应 该 不 加 改变 地 直接 被 包含 到 全 局 模型 中 。 
(7) 查验 遗漏 的 实体 /关系 和 联系 / 外 部 关键 字 

也 许 在 生成 全 局 模型 时 一 个 最 困难 的 任务 就 是 ， 寻 找 不 同 局 部 数据 模型 之 间 遗 漏 的 实体 / 
关系 和 联系 / 外 部 关键 字 。 如 果 企 事业 单位 的 数据 模型 已 经 建立 ， 这 种 遗漏 可 能 揭示 出 某 些 
实体 或 者 联系 没有 被 任何 局 部 数据 模型 所 包含 。 作 为 一 种 预防 性 的 手段 ， 在 与 某 个 特定 用 户 
视图 的 用 户 会 谈 时 ， 要 请 他 们 特别 留意 其 他 视图 中 已 经 存在 的 实体 和 联系 。 否 则 ， 就 要 分 析 
每 个 实体 /关系 的 属性 ， 找 出 这 些 属 性 对 其 他 局 部 数据 模型 中 的 实体 /关系 的 引用 。 这 样 做 ， 
就 有 可 能 发 现 一 个 局 部 数据 模型 中 的 某 个 实体 /关系 的 某 个 属性 对 应 另外 一 个 局 部 数据 模型 
中 某 个 实体 /关系 的 主 关键 字 、 可 替换 关键 字 甚 至 非 关键 字 属性 。 
(8) 查验 外 部 关键 字 

经 过 上 述 步骤 ,实体 /关系 和 联系 / 外 部 关键 字 可 能 被 合并 ， 主 关键 字 可 能 被 修改 ， 也 
可 能 会 添加 新 的 联系 。 因 此 在 本 步骤 中 ， 我 们 要 复查 子 关 系 中 的 外 部 关键 字 是 否 仍然 正 
确 ， 大 需要 ， 则 进行 必要 的 修改 。 图 17-8 给 出 了 DreamHome 的 全 局 逻辑 数据 模型 中 的 
关系 。 
(9) 查验 完整 性 约束 

复查 完整 性 约束 ,保证 全 局 逻辑 数据 模型 的 完整 性 约束 和 每 个 视图 原 有 约束 之 间 没 有 冲 
突 。 例 如 ， 如 果 增 加 了 新 的 联系 ,创建 了 新 的 外 部 关键 字 ， 就 要 确保 定义 了 恰当 的 引用 完整 
性 约束 。 如 果 有 冲突 ， 则 必须 同 用 户 商 谈 后 再 解决 。 
(10) 画 出 全 局 ER/ 关 系 图 

现在 我 们 可 以 画 出 所 有 合并 以 后 的 局 部 数据 模型 的 图 。 如 果 是 在 关系 的 基础 上 进行 合 
并 ， 则 该 图 就 是 全 局 关系 图 ， 全 局 关系 图 显示 了 所 有 的 主 关键 字 和 外 部 关键 字 。 如 果 合 并 的 
是 局 部 ER 图 ， 则 结果 图 就 是 全 局 ER 图 。DreamHome 的 全 局 关系 图 如 图 17-9 所 示 。 
(11) 更 新 文档 

更 新 文档 ， 以 反映 在 生成 全 局 数据 模型 过 程 中 的 所 有 变化 。 保 持 文档 最 新 ， 并 且 文 档 要 
能 够 反映 当前 的 数据 模型 ， 这 一 点 非常 重要 。 如 果 在 以 后 数据 库 的 实现 过 程 中 ， 或 者 在 维护 
过 程 中 又 对 数据 模型 进行 了 修改 ， 则 文档 也 应 该 保持 同步 更 新 。 陈 旧 过 时 的 信息 会 给 以 后 的 
工作 造成 混乱 。 
步骤 2.6.2 验证 全 局 逻辑 数据 模型 


目标 | 如 果 需 要 的 话 ， 用 规范 化 方法 对 全 局 逻辑 数据 模型 中 创建 的 关系 进行 验证 ， 确 保 它 
们 支持 所 需 的 事务 。 
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Branch (branchNo, street, city, postcode, mgrStaffNo) 
主 关键 字 branchNo 

可 替换 关键 字 postcode 

外 部 关键 字 mgrStaffNo 引用 Manager(staffNo) 


Staff (staffNo, fName, IName, position, sex, DOB, salary, 
supervisorStaffNo, branchNo) 


主 关键 字 staffNo 
外 部 关键 字 supervisorStaffNo 引用 Staff(staffNo) 
外 部 关键 字 branchNo 引用 Branch(branchNo) 


PrivateOwner (ownerNo, fName, IName, address, telNo) 


主 关键 字 ownerNo 


PropertyForRent (propertyNo, street, city, postcode, type, 
rooms, rent, ownerNo, staffNo, branchNo) 
主 关键 字 propertyNo 
外 部 关键 字 ownerNo 引用 PrivateOwner(ownerNo) and 
BusinessOwner(ownerNo) 
外 部 关键 字 staffNo 引用 Staff(staffNo) 
外 部 关键 字 branchNo 引用 Branch(branchNo) 


Client (clientNo, fName, IName, telNo, eMail, pref Type, maxRent) 


+ BEF clientNo 
可 替换 关键 字 eMail 


Lease (leaseNo, paymentMethod, depositPaid, rentStart, 
rentFinish, clientNo, propertyNo) 


主 关键 字 leaseNo 

可 替换 关键 字 propertyNo, rentStart 

可 替换 关键 字 clientNo, rentStart 

外 部 关键 字 clientNo 引用 Client(clientNo) 

外 部 关键 字 propertyNo 引用 PropertyForRent(propertyNo) 
导出 deposit (PropertyForRent.rent*2) 

导出 duration (rentFinish ~ rentStart) 


Advert (propertyNo, newspaperName, dateAdvert, cost) 

主 关键 字 propertyNo, newspaperName, dateAdvert 
外 部 关键 字 propertyNo 引用 PropertyForRent(propertyNo) 
外 部 关键 字 newspaperName 引用 


Newspaper(newspaperName) 
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Telephone (telNo, branchNo) 
主 关键 字 telNo 
外 部 关键 字 branchNo 引用 Branch(branchNo) 


Manager (staffNo, mgrStartDate, bonus) 
主 关键 字 staffNo 
外 部 关键 字 staffNo 引用 Staff(staffNo) 


BusinessOwner (ownerNo, bName, blype, contactName, 
address, telNo) 


主 关 键 字 ownerNo 
可 替换 关键 字 bName 
可 替换 关键 字 telNo 


Viewing (clientNo, propertyNo, dateView, comment) 

主 关键 字 clientNo, propertyNo 

外 部 关键 字 clientNo 引用 Client(clientNo) 

外 部 关键 字 propertyNo 引用 PropertyForRent(propertyNo) 


Registration (clientNo, branchNo, staffNo, dateJoined) 
主 关键 字 clientNo, branchNo 

外 部 关键 字 clientNo 引用 Client(clientNo) 
外 部 关键 字 branchNo 引用 Branch(branchNo) 
外 部 关键 字 staffNo 引用 Staff(staffNo) 


Newspaper (newspaperName, address, telNo, contactName) 
主 关键 字 newspaperName 
可 替换 关键 字 telNo 





图 17-8 DreamHome 全 局 逻辑 数据 模型 中 的 关系 


步骤 2.6.2 和 步骤 2.2. APG 2.3 中 对 局 部 逻辑 数据 模型 的 验证 相同 。 不 过 ， 这 里 只 需要 
检查 在 合并 过 程 中 发 生变 化 的 那 部 分 模型 。 在 大 型 系统 中 ， 这 种 操作 模式 将 明显 减少 需要 完 
成 的 复查 工作 量 。 
步骤 2.6.3 与 用 户 一 起 复查 全 局 逻辑 数据 模型 


目标 | 和 用 户 一 起 复查 全 局 逻辑 数据 模型 ， 确 保 用 户 能 够 认可 该 模型 真实 地 表示 了 企 事 业 


现在 到 了 完善 企 事业 单位 全 局 逻辑 数据 模型 的 时 候 了 ， 力 求 模型 的 完全 性 和 正确 性 。 我 
们 应 该 和 用 户 一 起 对 模型 以 及 描述 模型 的 文档 进行 复查 ， 确 保 该 模型 表示 了 企 事 业 单位 数据 
的 真实 需求 。 

为 了 方便 描述 步骤 2.6 中 的 任务 ， 我 们 使 用 了 术语 “局 部 逻辑 数据 模型 ”和 “全 局 逻辑 
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数据 模型 ”。 不 过 这 个 步骤 完成 以 后 ， 所 有 的 局 部 逻辑 数据 模型 都 被 合并 为 一 个 全 局 逻辑 数 
据 模型 ， 因 此 也 就 没有 必要 再 区 分 模型 究 竞 表示 的 是 部 分 视图 还 是 全 部 视图 。 因 此 ， 在 方法 
学 后 面 的 步骤 中 ， 我 们 都 将 使 用 术语 “逻辑 数据 模型 ”表示 “全 局 逻辑 数据 模型 ”。 
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dateAdvert {PK} 





re are 
Displays | 1..1 


newspaperName {PK} 


图 17-9 DreamHome 的 全 局 关系 图 
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WR 2.7 ”检查 模型 对 未 来 可 拓展 性 的 支持 


目标 | 判断 在 可 预见 的 未 来 系统 需求 是 否 会 有 明显 的 变化 ， 并 且 对 逻辑 数据 模型 能 否 适 应 
这 些 变 化 进行 评估 。 


在 逻辑 数据 库 设 计 的 最 后 阶段 要 考虑 的 问题 是 : 逻辑 数据 模型 (经 历 或 者 可 能 没有 经 历 
步骤 2.6) 是 否 能 被 扩展 以 支持 未 来 可 能 的 开发 需求 。 如 果 一 个 模型 只 能 支持 当前 的 需求 ， 
这 个 模型 的 生命 周期 就 可 能 很 短 ， 并 且 为 了 适应 新 的 需求 ， 可 能 需要 做 很 大 的 改动 才 行 。 开 
发 一 个 可 扩展 的 模型 非常 重要 ， 该 模型 应 该 具有 可 演化 的 能 力 以 支持 新 的 需求 ， 同 时 最 小 限 
度 地 影响 老 用 户 的 使 用 。 当 然 ， 这 可 能 很 难 做 到 ， 因 为 企 事业 单位 自己 都 可 能 不 知道 它 将 来 
需要 什么 。 不 过 即使 企 事 业 单 位 清楚 未 来 所 需 ,， 也 可 能 会 放弃 ， 因 为 要 想 实现 适应 未 来 可 能 
的 需求 而 具备 的 可 扩展 性 ， 在 时 间 上 和 费用 上 都 要 有 很 高 的 投入 。 所 以 需要 对 模型 应 该 适应 
什么 进行 选择 。 总 而 言 之 ， 这 样 做 是 值得 的 ， 即 对 全 局 模型 进行 分 析 ， 以 查验 模型 在 影响 最 
小 的 前 提 下 的 可 扩展 能 力 。 不 过 除非 用 户 提 出 明确 的 需求 ， 否 则 没有 必要 把 任何 变化 都 合并 
到 数据 模型 中 来 。 

在 步骤 2 的 最 后 ， 逻 辑 数 据 模 型 将 被 用 作物 理 数据 库 设 计 的 数据 源 ， 在 后 面 的 两 章 中 ， 
继续 介绍 方法 学 的 步骤 3 到 步骤 8， 主 要 讨论 物理 数据 库 的 设计 方法 学 。 

对 于 熟悉 数据 库 设计 的 读者 ， 可 以 参考 附录 D 中 给 出 的 对 方法 学 各 个 步骤 的 概述 。 


本 章 小 结 

e 数据 库 设 计 方法 学 包括 三 个 主要 的 阶段 : 概念 数据 库 设计 、 钦 辑 数据 库 设 计 和 物理 数据 库 设 计 。 

e 逻辑 数据 库 设 计 是 基于 一 个 特定 的 数据 模型 (比如 关系 模型 ) 创建 一 个 企 事 业 单 位 使 用 的 数据 模型 
的 过 程 ， 但 独立 于 特定 的 DBMS 和 其 他 物理 上 的 考虑 。 

e 逻辑 数据 模型 包括 ER 图 、 关 系 模式 以 及 支撑 文档 ， 支 撑 文档 包括 了 在 开发 模型 的 过 程 中 生成 的 数 
据 字 上 典 。 

e 方法 学 中 迎 辑 数据 库 设 计 的 步骤 2.1 的 目标 是 根据 步骤 1 创建 的 概念 数据 模型 导出 关系 模式 。 

步骤 2.2 用 规范 化 方法 验证 关系 模式 ,确保 每 个 关系 在 结构 上 都 是 正确 的 。 可 以 利用 规范 化 的 方法 

改进 模型 ， 使 之 满足 某 些 约束 ， 去 掉 不 必要 的 元 余 。 步 又 2.3 则 验证 关系 模式 ,确保 其 支持 用 户 需 

求 规格 说 明 书 中 列 出 的 事务 。 

步骤 2.4 查验 逻辑 数据 模型 的 完整 性 约束 。 附 加 在 数据 库 上 的 完整 性 约束 是 为 了 防止 出 现 不 完整 、 

不 正确 和 不 一 致 的 情况 。 完 整 性 约束 主要 有 必须 有 值 的 数据 约束 、 属 性 域 约束 、 多 重 性 约束 、 实 体 

完整 性 约束 、 引 用 完整 性 和 一 般 性 约束 。 

在 步骤 2.5 中 ,需要 和 用 户 一 起 验证 逻辑 数据 模型 。 

e 逻辑 数据 库 设计 的 步骤 2.6 是 一 个 可 选 步 又， 只 有 在 数据 库 有 多 个 用 户 视图 ， 并 且 使 用 集成 的 方法 
处 理 这 些 视图 时 (参见 10.5 节 ) 才 需 要 ， 因 为 多 个 视图 会 生成 两 个 或 者 多 个 局 部 逻辑 数据 模型 。 局 
部 逻辑 数据 模型 表示 数据 库 的 一 个 或 者 多 个 〈 但 不 是 全 部 ) 用 户 视图 的 数据 需求 。 步 骤 2.6 将 这 些 
局 部 逻辑 数据 模型 合并 为 一 个 表示 所 有 用 户 视图 的 全 局 逻辑 数据 模型 。 需 要 针对 所 需 事务 对 全 局 小 
辑 数据 模型 进行 规范 化 验证 ， 并 且 得 到 用 户 的 确认 。 

e 人 逻辑 数据 库 设 计 还 包括 步骤 2.7， 该 步骤 检查 模型 是 否 能 够 扩充 以 支持 未 来 可 能 的 应 用 。 在 步骤 2 
的 最 后 ， 人 逻辑 数据 模型 (不 管 是 否 用 到 步骤 2.6 ) 将 被 用 作物 理 数据 库 设 计 的 数据 源 ， 物 理 数 据 库 
设计 (步骤 3 一 步骤 8 ) 将 在 后 续 两 章 讨论 。 
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思考 题 


17.1 讨论 逻辑 数据 库 设 计 的 目的 。 
17.2 ”描述 将 下 列 类 型 转换 为 关系 的 规则 ， 举 例 说 明 : 
(a) 强 实体 类 型 
(b) 弱 实 体 类 型 
(c) 一 对 多 (1:*) 二 元 联系 类 型 
(d) 一 对 一 (1:1) 二 元 联系 类 型 
(e) 一 对 一 (1:1) 递归 联系 类 型 
(£) EX / 子 类 联系 类 型 
(g) 多 对 多 (*:*) 二 元 联系 类 型 
(h) 复杂 联系 类 型 
(i) 多 值 属 性 
17.3 讨论 如 何 使 用 规范 化 技术 验证 从 概念 数据 模型 中 导出 的 关系 。 
17.4 ”讨论 用 于 验证 关系 模式 如 何 支 持 所 需 事 务 的 两 种 方法 。 
17.5 ”描述 完整 性 约束 的 目的 并 给 出 逻辑 数据 模型 上 主要 的 完整 性 约束 。 
17.6 ”描述 删除 有 子 元 组 引用 的 父 元 组 时 可 选 的 几 种 策略 。 
17.7 给 出 将 局 部 逻辑 数据 模型 合并 为 全 局 逻辑 数据 模型 的 典型 活动 。 


习题 
17.8 从 图 17-10 所 示 的 概念 数据 模型 中 导出 关系 。 
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17-10 ”一 个 概念 数据 模型 的 例子 


R1ITË BP H ARA KEKEE 391 


DreamHome 案例 研究 
17.9 ”基于 习题 16.13 生成 的 概念 数据 模型 ， 创 建 DreamHome 的 用 户 视图 Branch 的 关系 模式 ， 并 将 
该 模式 与 图 17-5 中 列 出 的 关系 进行 比较 ， 讨 论 它 们 的 不 同 。 

University Accommodation Office 案例 研究 

17.10 “为 习题 16.16 中 创建 的 University Accommodation Office 的 概念 数据 模型 创建 逻辑 数据 模型 ， 
并 对 其 进行 验证 。 

EasyDrive School of Motoring 案例 研究 

17.11 为 习题 16.18 中 创建 的 EasyDrive School of Motoring 的 概念 数据 模型 创建 逻辑 数据 模型 ， 并 对 
其 进行 验证 。 

Wellmeadows Hospital 案例 研究 

17.12 “为 习题 16.21 中 给 出 的 Wellmeadows Hospital 的 每 个 局 部 概念 数据 模型 创建 局 部 逻辑 数据 模 
型 ， 并 对 其 进行 验证 。 

17.13 合并 局 部 数据 模型 ， 创 建 Wellmeadows Hospital 的 全 局 逻辑 数据 模型 。 并 说 明 为 支持 你 的 设计 
所 做 的 假设 。 

Parking Lot 案例 研究 

17.14 将 在 习题 12.13 和 习题 13.11 中 描述 、 图 17-11 中 显示 的 停车 场 EER 图 映射 为 关系 模式 。 


ParkingLot 


parkingLotName 
location 
capacity 
noOfFloors 










{Mandatory, Or} 





dateRequired 
visitorVLicenseNo 










0..* 


图 17-11 #43 EER 图 


Library 案例 研究 
17.15 ”将 在 习题 12.14 和 习题 13.12 中 描述 、 图 17-12 中 显示 的 图 书馆 EER 图 映射 为 关系 模式 。 
17.16 图 17-13 所 示 ER 图 仅 有 实体 和 主 关键 字 属 性 。 没 给 出 实体 和 联系 可 识别 的 名 字 是 为 了 强调 前 
面 在 逻辑 数据 库 设 计 步 又 2.1 中 给 出 的 映射 是 规则 性 的 。 回 答 下 列 有 关 如 何 将 图 17-13 中 的 
ER 模型 映射 为 关系 模型 的 问题 。 
(a) 表示 这 个 ER 模型 需要 多 少 个 关系 ? 
(b) 有 多 少 个 外 部 关键 字 被 映射 到 表示 X 的 关系 中 ? 
(c) 哪个 ( 些 ) 关系 将 没有 外 部 关键 字 ? 
(d) 仅 用 每 个 实体 已 有 的 字母 标识 符 ， 为 从 ER 模型 映射 得 到 的 关系 合适 地 命名 。 
(e) 如 果 将 该 ER 模型 变 为 这 样 一 个 版 本 ， 即 所 有 联系 的 基数 都 为 1: 1 的 ,并且 所 有 实体 都 完 
全 参与 联系 ， 那 么 应 该 导出 多 少 个 关系 ? 
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图 17-13 一 个 ER 模型 的 例子 
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Database Systems: A Practical Approach to Design, Implementation, and Management, 6E 


方法 学 一 一 关系 数据 库 的 物理 数据 库 设 计 








本 章 我 们 主要 学 习 : 

物理 数据 库 设 计 的 目标 

如 何 将 催 辑 数据 库 设计 映射 为 物理 数据 库 设计 
如 何 为 目标 DBMS 设计 基础 关系 

如 何 为 目标 DBMS 设计 一 般 性 约束 

如 何 基 于 对 事务 的 分 析 选 择 合适 的 文件 组 织 方式 
何 时 使 用 辅 索引 来 提高 性 能 

如 何 估计 数据 库 的 大 小 

如 何 设计 用 户 视 图 

如 何 设计 满足 用 户 需 求 的 安全 机 制 


本 和 草 及 下 一 章 ， 我 们 都 将 通过 示例 来 说 明 关 系数 据 库 的 物理 数据 库 设计 方法 学 。 

本 章 以 第 16 EA 17 章 讨论 的 方法 学 中 建立 的 逻辑 数据 模型 和 文档 作为 起 点 。 概 念 / 逻 
辑 数据 库 设计 方法 学 的 步骤 1 生成 了 概念 数据 模型 ， 步 又 2 由 此 导出 一 组 关系 ， 建 立 了 逻辑 
数据 模型 。 所 导出 的 关系 都 通过 第 14、15 章 介绍 的 规范 化 技术 验证 了 结构 的 正确 性 ， 并 保 
证 能 支持 用 户 需 求 的 事务 。 

在 数据 库 设计 方法 学 的 第 三 阶段 ， 也 是 最 后 一 个 阶段 ， 设 计 者 必须 决定 如 何 将 数据 库 的 
逻辑 设计 〈 这 是 指 实 体 、 属 性 、 联 系 和 约束 等 ) 转化 为 可 以 在 目标 DBMS 中 实现 的 物理 数据 
库 设计 。 因 为 物理 数据 库 设 计 的 许多 方面 都 高 度 依赖 于 目标 DBMS ， 所 以 数据 库 的 很 多 部 分 
都 可 能 存在 多 种 实现 方式 。 想 要 圆满 完成 这 项 工作 ,设计 者 必须 对 目标 DBMS 的 功能 非常 
熟悉 ， 并 了 解 各 种 实现 方法 的 优 缺 点 。 茶 些 系统 还 要 求 设计 者 选择 一 种 合适 的 存储 策略 来 适 
应 特殊 的 数据 库 使 用 需求 。 


ge Be ob Al 
ERTS 


18.1 节 将 逻辑 数据 库 设 计 和 物理 数据 库 设 计 加 以 比较 。18.2 节 给 出 了 物理 数据 库 设 计 
方法 学 的 概述 ， 并 简要 描述 了 各 个 设计 阶段 的 主要 活动 。18.3 节 重 点 讨论 物理 数据 库 设 计 
方法 学 ， 并 详细 讲述 了 建立 一 个 物理 数据 模型 需要 进行 的 前 四 步 工 作 。 这 些 步骤 展示 了 如 何 
将 为 逻辑 数据 模型 导出 的 关系 转化 为 特定 的 数据 库 实现 。 我 们 给 出 了 为 基础 关系 选择 存储 结 
构 以 及 什么 时 候 建 立 索引 的 指南 。 为 了 阐明 这 些 内 容 ， 书 中 在 很 多 地 方 都 给 出 了 物理 实现 的 
细节 。 

第 19 章 讨论 如 何 监控 系统 和 进行 系统 调 优 ， 以 完成 物理 数据 库 设计 方法 学 的 讨论 。 此 
外 ， 还 讲解 了 何 时 采用 逆 规 范 化 的 逻辑 数据 模型 ， 引 入 可 控 的 数据 元 余 。 对 于 已 经 熟悉 数据 
库 设计 并 只 需 浏 览 主要 设计 步骤 的 读者 ， 可 以 直接 阅读 附录 D。 
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18.1 逻辑 数据 库 设 计 与 物理 数据 库 设计 的 比较 

本 书 讨论 数据 库 设计 方法 学 时 ， 将 设计 过 程 划 分 为 三 个 主要 阶段 : 概念 数据 库 设 计 、 逻 
辑 数据 库 设 计 和 物理 数据 库 设 计 。 物 理 数 据 库 设计 的 前 一 个 阶段 是 逻辑 数据 库 设 计 ， 这 个 阶 
段 高 度 独立 于 实现 细节 ， 比 如 独立 于 目标 DBMS 提供 的 特殊 功能 及 其 应 用 ,但 是 要 依赖 于 
目标 数据 模型 。 逻 辑 数据 库 设计 的 输出 结果 是 逻辑 数据 模型 ， 包 括 ER/ 关系 图 、 关 系 模式 ， 
以 及 描述 模型 的 支持 文档 ， 如 数据 字典 等 ， 这 些 信息 综合 在 一 起 就 是 物理 设计 阶段 的 信息 
源 ， 为 物理 数据 库 的 设计 者 提供 了 权衡 的 依据 ， 这 对 高 效 数据 库 设 计 极 其 重要 。 

钦 辑 数据 库 设 计 关 注 设 计 什么 ， 物 理 数 据 库 设 计 则 关注 如 何 实现 设计 。 这 两 个 设计 阶段 
分 别 需 要 不 同 的 技能 ， 而 且 这 些 技 能 往往 被 不 同 的 人 掌握 。 例 如 ， 物 理 数 据 库 的 设计 者 必须 
知道 计算 机 系统 怎样 支持 DBMS 操作 ， 并 且 需 要 对 目标 DBMS 的 功能 有 充分 的 了 解 。 因 为 
目前 各 种 DBMS 系统 提供 的 功能 在 各 方面 都 很 不 同 ， 所 以 物理 数据 库 的 设计 必须 与 某 种 特 
定 的 系统 相 适 应 。 不 过 ， 物 理 数据 库 设计 也 不 是 一 项 孤立 的 活动 一 一 通常 在 物理 设计 、 逻 辑 
设计 和 应 用 系统 设计 之 间 存 在 着 反馈 。 例 如 ， 在 物理 设计 阶段 为 提高 系统 性 能 做 出 的 一 些 取 
E, 如 合并 关系 等 ， 可 能 会 影响 逻辑 数据 模型 的 结构 ， 进 而 影响 应 用 系统 的 设计 。 


18.2 ”物理 数据 库 设 计 方 法 学 概述 


物理 数据 库 设计 | 在 二 级 存储 器 上 实现 数据 库 描 述 的 过 程 ， 这 些 描 述 包 括 基础 关系 、 文 件 
组 织 、 为 实现 数据 的 高 效 访问 而 建立 的 索引 、 相 关 的 完整 性 约束 以 及 安全 策略 ， 等 等 。 


物理 数据 库 设 计 方 法 学 的 步骤 如 下 : 
步骤 3 转换 逻辑 数据 模型 以 适应 目标 DBMS 
步骤 3.1 设计 基础 关系 
步骤 3.2 设计 导出 数据 的 表示 方法 
步骤 3.3 设计 一 般 性 约束 
PRA 设计 文件 组 织 方法 和 索引 
步骤 4.1 分 析 事 务 
步骤 4.2 选择 文件 组 织 方法 
步骤 4.3 选择 索引 
步骤 4.4 估计 所 需 的 磁盘 空间 
步骤 5 设计 用 户 视图 
步骤 6 设计 安全 机 制 
FRI 考虑 引入 可 控 宛 余 
FRE 监控 系统 和 系统 调 优 
本 书 讲述 的 物理 数据 库 设计 方法 学 被 划分 为 六 个 主要 的 步骤 ， 步 又 编号 从 3 开始 ， 紧 跟 
在 概念 数据 库 设 计 和 逻辑 数据 库 设计 方法 学 的 两 个 步骤 之 后 。 物 理 数 据 库 设计 的 步骤 3 利用 
目标 DBMS 所 提供 的 功能 ， 设 计 实 现 基础 关系 和 一 般 性 约束 。 这 一 步 还 要 考虑 数据 模型 中 
导出 数据 的 表示 方式 。 
步骤 4 的 活动 包括 为 基础 关系 选择 文件 的 组 织 方 式 和 索引 方式 。 一 般 情 况 下 ，PC 上 的 
DBMS 都 有 固定 的 存储 结构 ， 但 其 他 类 型 的 DBMS 则 往往 提供 了 多 种 可 以 选择 的 数据 组 织 
方式 。 从 用 户 的 角度 来 看 ， 关 系 的 内 部 存储 方式 应 该 是 透明 的 一 一 用 户 不 需要 知道 元 组 存储 
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的 方式 和 位 置 就 能 够 访问 元 组 和 关系 。 这 就 需要 DBMS 提供 物理 数据 独立 性 ， 使 得 用 户 不 
受 数据 库 物 理 存 储 结构 的 影响 ， 就 像 在 2.1.5 节 中 讨论 的 那样 。 内 部 模式 里 定义 了 逻辑 数据 
模型 和 物理 数据 模型 之 间 的 映射 关系 ， 参 见 图 2-1。 设 计 者 可 能 需要 向 DBMS 和 操作 系统 提 
供 物理 设计 的 细节 。 对 于 DBMS, 设计 者 可 能 需要 指定 每 个 关系 的 文件 组 织 方式 。 对 于 操作 
系统 ， 设 计 者 则 必须 指定 诸如 每 个 文件 的 位 置 和 保护 方式 等 细节 。 建 议 读者 在 阅读 方法 学 的 
步骤 4 之 前 最 好 先 参 考 附录 下 中 关于 文件 组 织 和 存储 结构 方面 的 内 容 。 

步骤 5 考虑 如 何 选 择 每 个 用 户 视 图 的 实现 方式 。 步 又 6 则 是 设计 为 了 保护 数据 不 被 未 授 
权 者 访问 而 采取 的 必要 安全 措施 ， 包 括 基础 关系 中 需要 的 访问 控制 。 

步骤 7 (在 第 19 章 讨 论 ) 考虑 为 了 提高 系统 整体 效率 ， 放 宽 加 在 逻辑 数据 模型 上 的 规范 
化 约束 。 该 步骤 仅 在 需要 时 才 使 用 ， 因 为 引入 数据 元 余 可 能 会 给 保持 一 致 性 带 来 问题 。 步 又 
8 (参见 第 19 章 ) 是 在 对 运行 的 系统 进行 监控 时 ， 找 出 并 解决 设计 中 出 现 的 各 种 问题 ， 从 而 
满足 新 的 或 者 变化 了 的 需求 。 

附录 D 是 数据 库 设 计 方 法 学 的 概述 ， 适 合 于 那些 熟悉 数据 库 的 设计 并 且 只 需要 简单 浏 
览 主 要 设计 过 程 的 读者 阅读 。 


18.3 关系 数据 库 的 物理 数据 库 设计 方法 学 


本 节 逐 步 介绍 关系 数据 库 的 物理 数据 库 设 计 的 前 四 个 步 又。 我 们 通过 讲述 不 同 的 设计 在 
不 同 目标 DBMS 上 的 实现 ， 来 说 明 物理 数据 库 设计 与 实现 之 间 的 密切 关系 。 余 下 的 两 个 步 
又 则 留待 下 一 章 讨 论 。 


步骤 3 转换 逻辑 数据 模型 以 适应 目标 DBMS 
| 目标 | 根据 逻辑 数据 模型 生成 可 以 在 目标 DBMS 上 实现 的 关系 数据 库 模式 。 


物理 数据 库 设 计 的 第 一 个 活动 就 是 将 逻辑 数据 模型 中 的 关系 转换 成 可 由 目标 关系 DBMS 
实现 的 形式 。 在 转换 过 程 中 ， 第 一 部 分 工作 就 是 将 逻辑 数据 库 设计 阶段 生成 数据 字典 时 收集 
的 信息 和 需求 分 析 阶 段 撰写 需求 规格 说 明 书 时 收集 的 信息 进行 比较 。 第 二 部 分 工作 则 是 根据 
这 些 信息 制定 基础 关系 的 设计 方案 。 这 个 过 程 需要 充分 了 解 目标 DBMS 所 提供 的 功能 。 例 
如 ， 设 计 者 有 必要 知道 : 

e 如 何 创 建 基础 关系 。 
系统 是 否 文 持 主 关键 字 、 外 部 关键 字 、 可 替换 关键 字 的 定义 。 
系统 是 否 支 持 必须 有 值 的 数据 约束 定义 ( 即 系统 是 否 允 许 属性 被 定义 为 NOT NULL), 
系统 是 否 支 持 域 的 定义 。 
系统 是 否 文 持 关系 的 完整 性 约束 。 

© 系统 是 否 文 持 完整 性 约束 的 定义 。 

步骤 3 又 可 以 划分 为 : 

步骤 3.1 设计 基础 关系 

步骤 3.2 设计 导出 数据 的 表示 方法 

步骤 3.3 设计 一 般 性 约束 
步骤 3.1 设计 基础 关系 


| 目标 | 决定 如 何在 目标 DBMS 中 表示 还 辑 数据 模型 中 的 基础 关系 。 
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进入 物理 设计 阶段 后 ， 我 们 首先 要 做 的 是 校对 和 接收 在 逻辑 数据 库 设 计 阶 段 产 生 的 关系 
的 信息 。 这 些 信息 可 以 从 数据 字典 以 及 使 用 数据 库 设 计 语 言 (DBDL) 摘 述 的 关系 定义 中 获 
得 。 人 逻辑 数据 模型 中 的 每 个 关系 的 定义 包含 以 下 内 容 : 

e 关系 名 。 

e 括号 中 的 简单 属性 表 。 

o 主 关键 字 、 可 替换 关键 字 (AK)( 如 果 有 的 话 ) 和 外 部 关键 字 (FK)。 

© 所 有 外 部 关键 字 的 引用 完整 性 约束 。 

从 数据 字典 中 ， 我 们 还 可 以 得 到 关于 每 个 属性 的 如 下 信息 : 

e 属性 域 ， 由 数据 类 型 、 长 度 和 域 约束 组 成 。 

e 一 个 可 选 的 属性 上 默认 值 。 
该 属性 值 是 否 能 为 空 。 
属性 是 否 是 导出 的 ， 如 果 是 ， 它 的 计算 方式 是 什么 。 

为 了 表示 基础 关系 的 设计 ， 我 们 使 用 扩充 的 DBDL 来 定义 域 、 默 认 值 和 NULL。 图 18-1 
给 出 了 DreamHome 案例 中 的 PropertyForRent 关系 的 设计 。 


Domain PropertyNumber: variable length character string, length 5 


Domain Street: variable length character string, length 25 


Domain City: variable length character string, length 15 

Domain Postcode: variable length character string, length 8 

Domain PropertyType: single character, must be one of ‘B’, ‘C, ‘D’, ‘FP, ‘FP, ‘H’, ‘M’, ‘S’ 

Domain PropertyRooms: integer, in the range 1-15 

Domain PropertyRent: monetary value, in the range 0.00—9999,99 

Domain OwnerNumber: variable length character string, length 5 

Domain Staff Number: variable length character string, length 5 

Domain BranchNumber: fixed length character string, length 4 

PropertyForRent( 

propertyNo PropertyNumber NOT NULL, 

street Street NOT NULL, 

city City NOT NULL, 

postcode Postcode, 

type PropertyType NOT NULL DEFAULT ‘P, 

rooms PropertyRooms NOT NULL DEFAULT 4, 

rent PropertyRent NOT NULL DEFAULT 600, 

ownerNo OwnerNumber NOT NULL, 

staffNo StaffNumber, 

branchNo BranchNumber NOT NULL, 

PRIMARY KEY (propertyNo), 

FOREIGN KEY (staffNo) REFERENCES Staff(staffNo) ON UPDATE CASCADE ON DELETE SET NULL, 

FOREIGN KEY (ownerNo) REFERENCES PrivateOwner(ownerNo) and BusinessOwner(ownerNo) 
ON UPDATE CASCADE ON DELETE NO ACTION, 

FOREIGN KEY (branchNo) REFERENCES Branch(branchNo) 
ON UPDATE CASCADE ON DELETE NO ACTION); 





图 18-1 PropertyForRent 关系 的 DBDL 定义 


基础 关系 的 实现 
下 一 步 决定 如 何 实现 基础 关系 。 基 础 关系 的 实现 需要 依赖 于 目标 DBMS ， 相 对 于 其 他 系 
统 来 说 ， 某 些 系统 提供 了 更 简便 的 方法 来 定义 基础 关系 。 此 前 ， 本 书 已 经 举例 说 明了 用 ISO 


398 PORD ZF 法 学 


SQL 标准 如 何 实现 基础 关系 (参见 7.1 节 )， 也 说 明了 用 Microsoft Office Access (参见 附录 
H.1.3 ) 和 Oracle (参见 附录 H.2.3 ) 如 何 实现 基础 关系 。 
用 文档 记录 基础 关系 的 设计 

应 该 详细 记录 下 基础 关系 的 设计 和 选择 如 此 设计 的 理由 。 特 别 是 当 存 在 多 种 实现 方法 
时 ， 要 记录 选用 其 中 一 种 方法 的 原因 。 


步骤 3.2 设计 导出 数据 的 表示 方法 
| 目标 | 决定 如 何在 目标 DBMS 中 表示 逻辑 数据 模型 中 的 导出 数据 。 


如 果菜 属性 的 值 可 以 通过 其 他 属性 的 值 计 算得 到 ， 则 称 该 属性 为 导出 属性 或 者 可 计算 属 
性 。 例 如 ， 下 面 的 属性 都 是 导出 属性 : 

e 在 某 个 分 公司 工作 的 员工 的 人 数 

e 所 有 员工 的 月 薪 总 和 

e 一 名 员工 管理 的 房产 数量 

通常 ， i 但 会 记录 在 数据 字典 中 。 如 果 导 出 属性 在 
模型 中 出 现 ， 我 们 常用 符号 “/” 来 说 明 它 是 一 个 导出 属性 (参见 12.1.2 节 )。 步 又 3.2 的 第 
ee 列 出 所 有 导出 属性 。 对 于 物理 数据 库 设 计 者 来 说 ， 是 
选择 将 导出 属性 存储 在 数据 库 中 ， 还 是 在 需要 的 时 候 再 计算 它 ， 需 要 仔细 权衡 。 设 计 者 应 该 
计算 : 

e 存储 导出 数据 的 开销 ， 以 及 保持 导出 数据 与 计算 导出 数据 的 原始 数据 之 间 的 一 致 所 

需要 的 额外 开销 。 

o 每 次 需要 时 再 计算 导出 属性 的 开销 。 

依据 性 能 要 求 ， 选 择 代价 较 小 的 方案 。 对 于 前 面 刚刚 提 到 的 那个 例子 ， 则 可 以 考虑 
在 关系 Staff 中 增加 一 个 额外 的 属性 来 表示 每 位 员工 当前 管理 的 房产 数量 。 图 18-2 的 关系 
Sta 任 是 根据 图 4-3 的 DreamHome 数据 库 的 实例 简化 而 来 的 ， 它 增加 了 一 个 新 的 导出 属性 
noOfProperties。 


PropertyForRent 


16 Holhead 

6 Argyll St 

6 Lawrence St 
2 Manor Rd 
18 Dale Rd 

5 Novar Dr 





18-2 KA PropertyforRent 和 具有 导出 属性 noOfProperties 的 简化 关系 Staff 
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增加 这 样 一 个 导出 属性 需要 增加 的 额外 存储 开销 并 不 是 很 大 。 但 是 每 当 分 配 (或 取消 分 
配 ) 一 名 员工 去 管理 一 处 房产 或 者 正 被 管理 房产 要 从 出 租房 产 列表 中 去 掉 时 ， 都 要 更 新 该 导 
出 属性 的 值 ， 即 对 应 员工 的 属性 noOfProperties 都 要 被 加 1 或 者 减 1。 必 须 确保 这 种 变化 的 
一 致 性 ， 从 而 维持 计数 的 正确 性 ， 进 而 保证 数据 库 的 完整 性 。 当 需要 查询 该 属性 时 ， 它 的 值 
可 以 立即 得 到 ， 不 需要 计算 。 男 一 方面 ， 如 果 这 个 属性 没有 直接 存储 在 关系 Staff F, BA 
每 次 访问 它 时 都 需要 重新 计算 。 这 就 涉及 到 关系 Staff 和 关系 PropertyForRent 的 一 次 连接 操 
作 。 所 以 ， 如 果 这 种 查询 很 频繁 ， 或 者 对 这 种 查询 的 运行 效率 要 求 很 高 ， 则 存储 该 导出 属性 
要 比 每 次 都 去 计算 它 的 方式 更 好 。 

当 DBMS 的 查询 语言 很 难 表示 导出 属性 的 计算 算法 时 ， 选 择 存 储 导 出 属性 也 更 合适 一 
些 。 就 像 我 们 在 第 6 章 中 讨论 的 那样 ，SQL 只 有 非常 有 限 的 聚集 国 数 ， 很 难处 理 递 归 查 询 。 
用 文档 记录 导出 数据 的 设计 

应 详细 记录 导出 数据 的 设计 以 及 确定 选择 某 种 设计 的 原因 。 特 别 是 ， 在 存在 多 种 设计 方 
法 时 ， 选 择 其 中 一 种 的 理由 。 
步骤 3.3 ”设计 一 般 性 约束 
| 目标 | 为 目标 DBMS 设计 一 般 性 约束 。 


关系 的 更 新 可 能 会 受到 完整 性 规则 的 限制 ， 这 些 规则 反映 了 “现实 世界 ”事务 更 新 活 
动 的 约束 。 在 步骤 3.1 P, 我们 已 经 设计 了 几 种 约束 : 必须 有 值 的 数据 约束 、 域 约束 、 实 
体 约束 和 引用 完整 性 约束 。 步 骤 3.3 要 考虑 剩 下 的 一 般 性 约束 。 一 般 性 约束 的 设计 也 依赖 
于 所 选择 的 DBMS， 与 其 他 DBMS 相 比 ， 某 些 DBMS 的 一 般 性 约束 的 定义 方式 更 加 简 
便 。 和 上 一 步 类 似 ， 如 果 目 标 DBMS 系统 和 SQL 标准 兼容 ， 则 很 容易 实现 某 些 约束 。 例 如 
DreamHome 有 一 条 规则 ， 不 允许 一 名 员工 同时 管理 100 处 以 上 的 房产 。 要 设计 实现 这 种 约 
R, 我 们 只 需要 在 创建 PropertyForRent #2 CREATE TABLE SQL 语句 中 使 用 如 下 的 子 句 : 

CONSTRAINT StaffNotHandlingTooMuch 

CHECK (NOT EXISTS (SELECT staffNo 
FROM PropertyForRent 
GROUP BY staffNo 
HAVING COUNT(*) > 100)) 

还 可 以 利用 8.3 节 中 介绍 的 触发 器 来 实现 约束 。 有 些 系统 可 能 不 支持 某 些 或 所 有 的 一 般 
性 约束 ， 这 时 就 需要 在 应 用 程序 中 设计 实现 这 些 约束 。 例 如 ， 现 在 很 少 有 关系 DBMS (WR 
有 的 话 ) 支持 这 样 的 时 间 约 束 : 在 每 年 最 后 一 个 工作 日 的 17:30， 对 当年 推销 出 的 所 有 房产 
记录 进行 存档 ， 并 删除 相关 的 记录 。 

用 文档 记录 一 般 性 约束 的 设计 
用 文档 记录 一 般 性 约束 的 设计 。 特 别 是 存在 多 种 设计 选择 时 ， 记 录 选 择 茶 种 设计 的 原因 。 


步骤 4 设计 文件 组 织 方法 和 索引 


目标 | 选择 最 佳 的 文件 组 织 方 式 来 存储 基础 关系 ， 以 及 为 了 获得 可 接受 的 性 能 而 建立 索引 ， 
也 就 是 关系 和 元 组 在 二 级 存储 器 中 的 组 织 方法 。 

物理 数据 库 设计 的 主要 目的 之 一 就 是 高 效 地 存储 和 访问 数据 (参见 附录 FF)。 有 的 存储 

结构 虽然 可 以 高 效 地 将 数据 批量 地 装载 到 数据 库 中 ,但 在 此 后 运行 时 效率 可 能 就 变 低 了 。 所 
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以 ， 我 们 可 能 需要 选择 一 种 高 效 的 存储 结构 来 建立 数据 库 ， 运 行 时 则 使 用 另 一 种 结构 。 

同样 ， 有 哪些 文件 组 织 方式 可 供 选 用 依赖 于 目标 DBMS, ， 相 比 而 言 ， 有 些 系统 提供 了 更 
多 的 可 供 选 择 的 存储 结构 。 物 理 数据 库 设 计 者 必须 完全 了 解 各 种 可 选 的 存储 结构 ， 以 及 目标 
系统 是 如 何 使 用 这 些 结构 的 。 这 可 能 需要 设计 者 去 了 解 系统 的 查询 优化 功能 。 例 如 ， 可 能 存 
在 这 样 的 情况 ， 即 使 存在 辅 索引 ， 查 询 优化 也 不 会 用 到 这 个 辅 索引 。 结 果 ， 增 加 一 个 辅 索引 
并 没有 提高 查询 的 效率 ， 只 是 昌 白 增加 了 开销 。 查 询 过程 和 优化 将 在 第 23 章 讨论 。 

和 逻辑 数据 库 设 计 不 同 的 是 ， 物 理 数 据 库 设计 必须 充分 考虑 数据 的 特性 和 用 途 。 特 别 
是 数据 库 设 计 者 必须 了 解数 据 库 的 日 常 负 荷 。 在 需求 收集 和 分 析 阶 段 ， 必 须 明 确 如 事务 需要 
运行 多 快 、 每 秒 钟 要 处 理 多 少 事 务 等 性 能 需求 。 这 些 信息 将 会 为 我 们 在 步骤 4 中 的 决定 提供 
依据 。 

记 住 本 步骤 的 目标 后 ， 接 下 来 我 们 将 讨论 步骤 4 中 的 活动 : 

步骤 4.1 分析 事 务 

步骤 4.2 选择 文件 组 织 方法 

步骤 4.3 选择 索引 

步骤 4.4 hit Pr Fe WY Be at 2 E 
步骤 4.1 分 析 事 务 


| 目标 | 理解 在 数据 库 上 运行 的 事务 的 功能 ， 对 重要 的 事务 进行 分 析 。 


为 了 高 效 地 进行 物理 数据 库 设 计 ， 了 解数 据 库 上 运行 的 事务 和 查询 非常 必要 ， 包 括 定性 
和 定量 的 信息 。 我 们 可 以 根据 某 些 性 能 准则 对 事务 进行 分 析 ， 例 如 : 

e 经 常 运 行 且 对 性 能 有 重大 影响 的 事务 是 什么 。 

© 在 业务 操作 中 的 关键 事务 是 什么 。 

o 每 天 / 周 中 ， 对 数据 库 请 求 最 多 ( 称 为 峰值 负载 ) 的 时 段 是 什么 。 

根据 这 些 信 息 可 以 确定 数据 库 中 可 能 引发 性 能 问题 的 事务 。 同 时 ， 我 们 还 需 确 定 事务 的 
高 层 功能 ， 比 如 更 新 事务 中 要 修改 的 属性 ,或 者 查询 中 元 组 的 检索 条 件 。 我 们 根据 这 些 信息 
来 选择 适当 的 文件 组 织 方式 和 索引 。 

在 很 多 情况 下 ， 对 所 有 事务 都 进行 分 析 是 不 可 能 的 ， 我 们 需要 选择 性 地 研究 那些 最 “ 重 
要 ”的 事务 。 研 究 表 明 数 据 总 查询 的 80% 来 自 最 活跃 的 20% 的 用 户 (Wiederhold, 1983). 
这 条 80/20 规则 可 以 作为 事务 分 析 的 指导 原则 。 为 了 确定 哪些 事务 需要 研究 ， 我 们 可 以 使 用 
事务 /关系 交叉 引用 给 阵 ， 它 描述 了 每 个 事务 访问 的 关系 和 事务 使 用 图 ， 用 图 形 化 的 方式 显 
示 了 哪些 关系 可 能 会 被 大 量 使 用 。 为 了 集中 分 析 容 易 引 发 问题 的 区 域 ， 我 们 可 以 : 

(1 ) 将 所 有 事务 路 径 映 射 到 关系 。 

(2 ) 找 出 事务 最 频繁 访问 的 关系 。 

(3 ) 分 析 与 这 些 关系 相关 的 重要 事务 的 数据 使 用 情况 。 

将 所 有 事务 路 径 映 射 到 关系 

在 概念 /逻辑 数据 库 设 计 方 法 学 的 步骤 1.8、 步 又 2.3 和 步骤 2.6.2 中 ， 我 们 通过 将 事务 
路 径 映 射 到 实体 /关系 来 验证 数据 模型 对 用 户 所 需 事务 的 支持 。 如 果 使 用 类 似 图 16.9 给 出 的 
事务 路 径 图 ， 我 们 就 可 以 通过 该 图 找 出 使 用 最 频繁 的 关系 。 男 一 方面 ， 如 果 还 需要 采用 其 他 
方式 验证 对 事务 的 支持 ， 那 么 事务 /关系 交叉 引用 和 抢 阵 的 创建 就 可 能 很 有 必要 。 该 矩阵 以 可 
视 化 的 方式 显示 了 企业 所 需 处 理 的 事务 以 及 这 些 事务 需要 访问 的 关系 。 例 如 ， 表 18-1 就 是 
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一 个 事务 / 关系 交叉 引用 和 矩阵， 其 中 包括 了 DreamHome 的 录入 、 更 新 /删除 和 查询 事务 ( 参 
见 附录 A): 
(A) 录入 一 项 新 房产 和 所 有 者 的 详细 信息 (如 Tina Murphy 
拥有 的 在 格拉 斯 哥 市 房产 编号 为 PG4 的 房产 的 详细 信息 )。 Jan 全 于 全 
(B) 更 新 /删除 房产 的 细节 。 
(C) 确定 在 格拉 斯 哥 市 各 分 公司 的 员工 总 数 。 
(D) 列 出 格拉 斯 哥 市 中 所 有 房产 的 房产 编号 、 地 址 、 类 型 、 
租金 (以 租金 为 序 )。 Jan ey 
(E) 列 出 某 指定 员工 所 管理 的 供出 租 的 房产 的 详细 情况 。 
(F) 确定 某 分 公司 中 每 位 员工 管理 的 房产 的 总 数 。 


R 18-1 事务 和 关系 交叉 引用 
Be ee ES Ee ST aes a E 


T 


事务 /关系 
ejvloli eviol' Rlviol' Rlvioli rlvioli rlvp 
paai T TTT EE et aE aeee ae 
repaos 1 [hed f pey ms septate Pp ads es 
sat txt Tt et TT et Et eag 
manatee 9) Se P| ap ae PET ace ed OP eel t 
PrivatcOwner E] | | | ttt? TTT TT TT TT tt tt 
pusinessOwner |X} | | | | | | ttt tt ttt tT ttt ty | 
Propenyronent |x| | | | p tt tt txt Tt dxdt tT [xt 
Wer ol a de Aele eee Er ed db 
RR DR BB re a es dy a Oa A 
Registration | | | tt tT tT ttt tT ttt tee ty tty 
tete BE RRR RRR REN TE 


Nowepeper yi gabre fo fee | sf bik bare sbike slo be sh sel sh sche ho de a 
aaen | 本 上 来 二 bbs | aas tah ap 四 夫 t 坟 0a ha ahy fet 


I 王 插入 ，R 三 读 取 ，U= 三 更 新 ，D= 三 删除 


从 该 矩阵 中 可 以 看 出 〈 仅 以 事务 (A) 为 例 ) : 事务 (A) ER Staff 表 ， 并 将 记录 插入 关系 
PropertyForRent 和 PrivateOwner/BusinessOwner 中 。 为 了 提供 更 多 更 有 用 的 信息 ， 和 矩阵 应 该 能 
够 显示 一 定时 间 间 隔 (如 每 小 时 、 每 天 或 每 周 ) 内 每 个 单元 的 访问 次 数 。 但 是 为 了 矩阵 的 简单 
易 读 ， 我 们 在 这 里 并 没有 显示 出 这 些 信息 。 从 该 矩阵 可 以 看 出 ， 关 系 Staff Al PropertyForRent 
被 6 个 事务 中 的 5 个 访问 ， 因 此 对 这 些 关 系 的 高 效 访问 可 以 有 效 地 避免 性 能 问题 的 产生 。 我 
们 也 因此 得 出 结论 : 对 这 些 事务 和 关系 进行 仔细 的 审查 是 很 有 必要 的 。 
确定 访问 频率 信息 

在 11.4.4 节 的 DreamHome 需求 说 明 书 中 ， 我 们 估计 约 有 100000 处 房产 可 以 出 租 ，2000 名 
员工 分 布 在 超过 100 个 分 公司 中 ， 每 个 分 公司 平均 有 1000 处 房产 ， 最 多 3000 处 房产 。 图 18-3 
给 出 了 事务 (C) (D), (E) 和 (F) 的 事务 使 用 图 ， 这 些 事务 都 至 少 访问 关系 Staff 和 关系 
PropertyForRent 中 的 一 个 ， 在 图 上 添加 了 期 望 返回 的 元 组 数目 。 因 为 关系 PropertyForRent 
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的 数据 量 很 大 ， 所 以 尽 可 能 高 效 地 访问 这 个 关系 就 显得 极其 重要 。 因 此 ， 有 必要 对 访问 该 关 
系 的 事务 进行 深入 分 析 。 






avg = 1000 


max = 100 max = 3000 


100000 


图 18-3 标明 了 期 望 返回 数 的 部 分 事务 的 事务 使 用 图 


对 每 个 事务 进行 分 析 时 ， 不 仅 要 知道 每 小 时 运行 次 数 的 最 大 值 和 平均 值 ， 还 要 知道 事务 
运行 的 日 期 和 时 间 ， 包 括 什 么 时 候 达 到 运行 峰值 等 。 例 如 ， 某 些 事务 可 能 在 大 多 数 的 时 间 都 
运行 在 平均 频率 上 ， 但 由 于 星期 五 早晨 要 开 例 会 的 缘故 ， 这 些 事务 在 每 个 星期 四 的 14 : 00 
到 16 : 00 之 间 都 在 峰值 频率 上 运行 。 有 的 事务 则 有 可 能 只 在 某 一 特定 时 间 才 运行 ， 比 如 周 
五 / 周 六 的 17: 00 ~ 19: 00, 同时 这 也 是 它们 的 峰值 运行 时 间 。 

当 事 务 需 对 某 些 关 系 进行 频繁 访问 时 ， 操 作 方 式 非常 重要 。 如 果 各 事务 的 操作 以 互 不 相 
关 的 方式 运行 ， 就 会 降低 产生 性 能 问题 的 风险 。 然 而 ， 如 果 这 些 事务 的 访问 操作 运行 时 相互 
冲突 ， 为 了 缓解 可 能 出 现 的 问题 ， 就 需要 对 这 些 事 务 进行 深入 细致 的 检查 ， 确 定 是 否 可 以 通 
过 改变 关系 的 结构 来 提高 性 能 ， 我 们 将 在 下 一 章 的 步骤 7 中 讨论 这 部 分 内 容 。 或 者 ， 我们 可 
以 重新 调度 某 些 事务 ， 使 得 事务 的 操作 不 再 发 生 冲突 (例如 ， 可 以 将 一 些 汇总 性 的 事务 安排 
在 晚上 系统 空闲 的 时 刻 进 行 )。 

分 析 数 据 使 用 情况 
确定 了 重要 的 事务 之 后 ， 还 要 对 每 个 事务 进行 更 加 详细 地 分 析 ， 我 们 需要 确定 : 
e 事务 访问 的 关系 和 属性 以 及 访问 的 类 型 ， 即 此 次 访问 是 搬入、 更 新、 删除 还 是 检索 
(也 称 为 查询 ) 事务 。 

对 于 更 新 事务 ， 注 意 被 修改 的 属性 ， 因 为 这 些 属性 的 修改 可 能 会 破坏 某 个 访问 结构 ( 比 
如 辅 索引 )。 

e 某 个 谓词 (在 SQL 中 ， 谓 词 是 WHERE 子 句 里 的 查询 条 件 ) 中 使 用 的 属性 。 检 查 该 

谓词 是 否 包括 : 

e 模式 匹配 ， 例 如 : (name LIKE ‘%Smith%’ ). 

e 范围 搜索 ， 例 如 : (salary BETWEEN 10000 AND 20000 ). 
KRSM ACA, PUN: (salary=30000 ) 。 

这 不 仅 适 用 于 查询 事务 ， 也 适用 于 更 新 和 删除 事务 ， 它 可 以 限制 关系 中 要 修改 /删除 元 
组 的 范围 。 

这 些 属 性 可 能 是 访问 结构 的 候选 关键 宁 。 

e 查询 中 连接 两 个 或 多 个 关系 的 属性 。 
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这 些 属性 也 可 能 是 访问 结构 的 候选 关键 字 。 

© 事务 运行 的 期 望 频率 ， 例 如 某 事务 每 天 运行 约 50 次 。 

。 事务 的 性 能 目标 ， 例 如 某 事务 必须 在 1 秒 钟 内 完成 。 

对 于 在 频繁 或 关键 事务 中 用 到 的 谓词 所 涉及 的 属性 ， 在 考虑 访问 结构 时 应 该 具有 较 高 的 
优先 权 。 I 

图 18-4 给 出 了 事务 (D) 的 事务 分 析 表 单 的 例子 。 该 表单 显示 了 该 事务 的 平均 运行 频 
率 为 每 小 时 50 次 ， 峰 值 出 现在 每 天 的 17: 00 一 19 : 00 之 间 ， 为 每 小 时 100 次 。 也 就 是 说 ， 
每 小 时 有 一 半 的 分 公司 会 运行 这 个 事务 ， 在 峰值 时 刻 ， 所 有 分 公司 每 小 时 都 会 运行 这 个 事务 
一 次 。 












假设 格拉 斯 哥 市 有 4 个 分 公司 





访问 数 
访问 类 型 
每 个 事务 每 小 时 平均 每 小 时 峰值 


Branch (entry) 100 10000 
PropertyForRent 4000-12000 200000-600000 | 400000-1200000 
总 访问 数 4100-12100 205000-605000 | 410000-1210000 


图 18-4 事务 分 析 表 单 示例 





1 
2 
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该 表单 还 给 出 了 事务 运行 时 所 涉及 的 SQL 语句 以 及 事务 使 用 图 。 在 这 个 阶段 ， 没 有 必 
要 使 用 完整 的 SQL 语句 ， 但 是 应 该 指出 相关 的 细节 ， 包 括 : 

e 需要 用 到 的 谓词 。 

e 连接 关系 (对 于 查询 事务 ) 时 需要 用 到 的 属性 。 
用 于 对 结果 进行 排序 的 属性 (对 于 查询 事务 ) 。 
用 于 对 数据 进行 分 组 的 属性 (对 于 查询 事务 ) 。 
要 用 到 的 聚集 函数 (如 AVG、SUM 等 )。 
可 能 被 事务 修改 的 属性 。 

这 些 信 息 可 以 帮助 我 们 确定 需要 建立 哪些 索引 (下面 将 要 讨论 )。 在 事务 使 用 图 的 下 面 ， 
还 有 一 个 详细 的 细 目 说 明 : 

© 如 何 访问 每 个 关系 〈 在 本 例 中 是 读 取 )。 

e 事务 运行 时 ， 每 次 访问 多 少 个 元 组 。 

e 平时 或 在 高 峰 时 期 ， 每 小 时 访问 多 少 元 组 。 

根据 这 些 频率 信息 ， 我 们 就 能 够 确定 对 哪些 关系 需要 仔细 考虑 ， 以 确保 查询 这 些 关 系 时 
采用 了 合适 的 访问 结构 。 而 对 于 访问 结构 的 使 用 ， 正 如 前 面 提 到 的 ,搜索 条 件 具 有 时 间 限 制 
的 事务 应 该 具有 较 高 的 权限 。 


步骤 4.2 ”选择 文件 组 织 方法 
| 目标 | 为 每 个 基础 关系 确定 高 效 的 文件 组 织 方式 。 


物理 数据 库 设 计 的 主要 目的 之 一 就 是 高 效 地 存储 和 访问 数据 。 例 如 ， 如 果 我 们 要 以 字 
母 顺序 来 读 取 员工 元 组 ， 那 么 按 员 工 名 字 的 顺序 来 存储 数据 就 是 一 种 好 的 文件 存储 方式 。 不 
过 ， 如 果 我 们 要 获取 工资 在 一 定 范围 内 的 所 有 员工 信息 ， 搜 索 用 名 字 排 序 文件 的 效率 就 不 会 
很 高 。 有 些 文件 组 织 方式 可 以 高 效 地 批量 载 入 数据 ， 但 数据 加 载 之 后 ， 这 种 文件 组 织 方式 的 
效率 就 不 那么 高 了 。 换 句 话 说 ,我 们 可 能 需要 采用 一 种 高 效 的 存储 结构 来 建立 数据 库 ， 进 入 
运行 阶段 后 再 改 为 男 外 一 种 存储 结构 。 

步骤 4.2 要 在 目标 DBMS 人 允许 的 前 提 下 ， 为 每 个 关系 选择 一 种 最 佳 的 文件 组 织 方式 。 
尽管 有 时 候 指明 了 索引 模式 之 后 就 意味 着 确定 了 文件 的 组 织 方式 ， 但 是 在 很 多 情况 下 ， 关 系 
DBMS 可 能 只 提供 少量 文件 组 织 方式 以 供 选 择 ， 或 者 根本 不 允许 用 户 选择 。 为 了 帮助 读者 更 
好 地 理解 文件 组 织 和 索引 ， 我 们 在 附录 F.7 中 给 出 了 基于 下 述 文件 类 型 选择 文件 组 织 方法 的 
一 般 性 原则 : 

o HE 

e 散 列 

e 索引 顺序 访问 方法 (ISAM) 

eB 树 

e RE 

WR HER DBMS 不 允许 选择 文件 组 织 方 式 ， 这 一 步骤 可 以 忽略 。 
用 文档 记录 文件 组 织 方式 的 选择 

记录 文件 组 织 方 式 的 选择 及 其 理由 ， 特 别 是 存在 多 种 选择 时 ， 选 择 其 中 之 一 的 原因 。 


步骤 4.3 ”选择 索引 
| 目标 | 决定 是 否 增 加 索引 以 提高 系统 的 性 能 。 
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为 关系 选择 文件 组 织 方式 的 方法 之 一 是 保持 元 组 的 无 序 ， 并 根据 需要 建立 足够 多 的 辅 索 
引 。 另 一 种 方法 是 通过 指定 主 索引 或 者 聚集 索引 对 关系 排序 (参见 附录 F.5 )。 这 种 情况 下 ， 
可 以 选择 如 下 的 属性 来 为 元 组 排序 或 者 建立 聚集 : 

© 和 常 被 用 来 进行 连接 操作 的 属性 ， 这 会 使 连接 操作 更 加 高 效 。 

e 儿 按 其 顺序 来 访问 关系 中 元 组 的 属性 。 

如 果 被 选 作 排序 用 的 属性 是 关系 中 的 关键 字 ， 该 索引 就 是 一 个 主 索 引 。 如 果 被 用 来 排 
序 的 属性 不 是 关键 字 ， 该 索引 就 是 聚集 索引 。 记 住 每 个 关系 只 能 拥有 一 个 主 索 引 或 者 聚集 
索引 。 
确定 索引 

在 7.3.5 节 中 ， 我 们 看 到 可 以 使 用 SQL 语句 CREATE INDEX 创建 索引 。 例 如 ， 在 关系 
PropertyForRent 中 的 属性 propertyNo 上 创建 一 个 主 索 引 的 SQL 语句 为 : 

CREATE UNIQUE INDEX PropertyNolnd ON PropertyForRent(propertyNo); 

在 关系 PropertyForRent 中 的 属性 staffNo 上 创建 一 个 聚集 索引 ， 可 以 使 用 下 面 的 SQL 语句 : 

CREATE INDEX StaffNolnd ON PropertyForRent(staffNo) CLUSTER; 

前 面 提 到 过 ， 在 一 些 系统 中 ， 文 件 的 组 织 方式 是 固定 的 。 例 如 ， 不 和 久 前 Oracle 还 只 
持 B* 树 ， 最 近 才 增加 了 对 聚集 的 支持 。 而 INGRES 则 提供 了 许多 不 同 的 索引 结构 ， 可 以 在 
CREATE INDEX 中 使 用 下 面 的 子 句 选择 : 


[STRUCTURE = BTREE | ISAM | HASH | HEAP] 


选择 辅 索引 

辅 索引 是 一 种 为 基础 关系 指定 附加 关键 字 的 机 制 ， 辅 索引 可 以 提高 数据 的 检索 效率 。 例 
如 ， 关 系 PropertyForRent 可 以 对 房产 编号 propertyNo 进行 散 列 ， 即 在 属性 propertyNo E Œ 
立 主 索引 。 但 是 可 能 基于 属性 rent 的 访问 也 很 频繁 。 这 种 情况 下 ， 我 们 可 以 增加 对 rent 的 
辅 索 引 。 

维护 和 使 用 辅 索 引 需 要 一 定 的 开销 ， 而 利用 辅 案 引 又 能 提高 检索 数据 的 性 能 ， 我 们 需要 
在 这 两 者 之 间 进 行 权 衡 。 这 些 开 销 包 括 : 

© 在 关系 中 插入 元 组 时 ， 需 要 在 每 个 辅 索 引 中 添加 索引 记录 。 

e 当 关 系 中 相应 的 元 组 被 修改 时 ， 也 要 修改 辅 索引 。 

© 存储 辅 索引 需要 增加 磁盘 空间 。 

o 可 能 会 降低 查询 优化 的 性 能 ， 因 为 在 选择 最 佳 的 执行 策略 时 ， 查 询 优化 可 能 会 考虑 

所 有 的 辅 索 引 。 
索引 “愿望 表 ” 创建 指南 

确定 需要 哪些 辅 索引 的 方法 之 一 是 为 那些 考虑 建立 索引 的 属性 建立 愿望 表 〈 wish-list), 

然后 检查 保留 每 个 索引 的 效果 。 建 立 索 引 的 愿望 表 时 可 以 参考 下 面 儿 条 : 

(1) 不 要 为 小 关系 建立 索引 。 在 内 存 中 搜索 关系 比 存储 附加 的 索引 结构 效率 更 高 。 

(2 ) 一 般 来 说 ， 如 果 一 个 主 关键 字 未 作为 文件 组 织 的 关键 字 ， 就 要 为 它 建立 索引 。 尽 管 
SQL 标准 提供 了 说 明 主 关键 字 的 子 句 ， 就 像 在 7.2.3 节 中 讨论 的 一 样 ， 但 这 并 不 能 
保证 一 定 会 对 主 关键 字 建 立 索 引 。 

(3) 如 果 一 个 外 部 关键 字 经 常 被 访问 ， 就 要 为 它 建立 一 个 辅 索 引 。 例 如 ， 如 采 我 们 
经 常 使 用 房产 所 有 者 编号 ownerNo 对 关系 PropertyForRent 和 关系 PrivateOwner/ 
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BusinessOwner 进行 连接 操作 。 则 在 关系 PropertyForRent 中 的 属性 ownerNo 上 添 
加 一 个 辅 索 引 就 会 获得 更 高 的 效率 。 注 意 ， 一 些 DBMS 会 自动 地 为 外 部 关键 字 建 
WRG. 

(4) 为 那些 频繁 作为 辅 关 键 字 使 用 的 属性 建立 索引 (例如 像 上 面 讨 论 的 ， 在 关系 
PropertyForRent 中 为 属性 rent 建立 辅 索引 )。 

(5) 为 经 党 在 如 下 操作 中 使 用 的 属性 建立 索引 : 

(a) 选择 或 连接 条 件 。 

(b) ORDER BY 子 句 中 。 

(c) GROUP BY 子 句 中 。 

(d) 其 他 包含 排序 的 操作 (如 UNION 或 DISTINCT)。 

(6) 对 于 内 置 的 聚集 函数 中 涉及 的 属性 ， 以 及 任何 内 置 函 数 使 用 的 属性 ， 我 们 都 可 以 为 
它们 建立 辅 索引 。 人 例如， 我们 可 以 使 用 如 下 的 SQL 查询 来 找 出 各 分 公司 员工 的 平 
HTI: 

SELECT branchNo, AVG(salary) 

FROM Staff 

GROUP BY branchNo; 

如 前 所 述 ， 因 为 有 GROUP BY 子 句 ， 我 们 可 以 考虑 为 属性 branchNo 添加 一 个 索 
引 。 但 如 果 考 虑 建 一 个 在 branchNo 和 salary 两 个 属性 上 的 索引 ， 效 率 可 能 会 更 高 。 
因为 这 使 得 DBMS 只 需 根 据 该 索引 就 可 完成 整个 查询 操作 ， 而 不 需要 访问 数据 库 
文件 本 身 。 这 种 方式 有 时 被 称 为 仅 用 索引 的 规划 ( index-only plan)， 因 为 只 使 用 索 
引 中 的 数据 就 能 啊 应 请 求 。 

(7) 将 上 一 条 一 般 化 ， 为 能 产生 仅 用 索引 规划 的 属性 添加 辅 索引 。 

(8) 避免 为 经 稍 需 更 新 的 关系 或 者 属性 建立 索引 。 

(9) 如 果 查 询 请 求 可 能 检索 出 关系 中 相当 比例 (如 大 于 25%) 的 元 组 ， 就 应 该 避免 为 关系 
中 的 属性 建立 索引 。 因 为 在 这 种 情况 下 ， 搜 索 整 个 关系 会 比 使 用 索引 检索 的 效率 更 高 。 

(10 ) 避免 为 由 长 字符 串 组 成 的 属性 建立 索引 。 

如 有 果 搜 索 条 件 中 包含 多 个 谓词 ， 并 且 其 中 某 项 含有 OR 子 句 ， 且 该 项 没有 索引 / 分 类 排 
序 ， 那 么 即使 为 其 他 属性 添加 索引 ， 也 不 会 提高 查询 的 速度 ， 因 为 仍然 需要 对 关系 进行 线性 
查找 。 例 如 ， 假 设 在 关系 PropertyForRent 中 ， 仅 对 属性 type 和 rent 建立 了 索引 ， 而 我 们 需 
要 执行 查询 : 

SELECT * 


FROM PropertyForRent 
WHERE (type = ‘Flat’ OR rent > 500 OR rooms > 5); 


尽管 这 两 个 索引 可 以 用 来 帮助 查找 满足 (type= ‘Flat’ or rent>500) 的 元 组 ,但 属性 
rooms 没有 索引 ， 这 意味 着 这 些 索引 不 能 被 整个 WHERE 子 句 使 用 。 因 此 ， 增 加 属性 type 
和 rent 上 的 索引 在 这 里 没有 任何 好 处 ， 除 非 它们 对 其 他 查询 有 用 。 

男 一 方面 ， 如 果 WHERE 子 句 中 的 谓词 是 以 AND 连接 的 ， 属 性 type 和 rent 上 的 索引 就 
可 以 被 用 来 优化 查询 操作 。 
从 愿望 表 中 去 除 索 引 

列 出 潜在 索引 的 愿望 表 后 ， 现 在 要 考虑 每 个 索引 对 更 新 事务 的 影响 。 如 果 索 引 的 维护 操 
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作 会 使 重要 的 更 新 事务 变 慢 ， 那 么 就 可 以 考虑 从 表 中 去 除 该 索引 。 但 是 也 要 注意 ， 某 个 索引 
也 可 能 会 使 更 新 操作 效率 更 高 。 例 如 ， 要 更 新 某 个 给 定员 工 编号 的 员工 的 工资 ， 如 果 拥 有 基 
于 属性 staffNo 的 索引 ， 则 找到 要 被 更 新 的 元 组 会 更 快 一 些 。 

如 果 有 可 能 ， 我 们 可 以 通过 实验 确定 一 个 索引 是 会 大 大 提高 系统 性 能 ， 还 是 只 41 有 很 小 的 
提高 ， 或 者 对 性 能 有 负面 的 影响 。 对 于 最 后 一 种 情况 ， 显 然 应 该 从 愿望 表 中 去 除 该 索引 。 加 
入 索引 后 ， 如 果 只 观察 到 了 系统 性 能 的 少许 提高 ， 我 们 就 有 必要 更 深入 地 进行 检查 ， 确 定 该 
索引 在 什么 情况 下 有 用 ， 并 且 这 些 情况 是 否 足 够 重要 ， 以 决定 是 否 实 现 该 索引 。 

有 些 系 统 允 许 用 户 查 看 执行 某 些 查询 或 者 更 新 的 最 优化 策略 ， 有 时 称 为 查询 执行 规 
划 ( Query Execution Plan，QEP)。 例 如 ，Microsoft Access 有 一 个 运行 分 析 器 ，Oracle 有 
EXPLAIN PLAN 诊断 功能 (参见 23.6.3 节 )，DB2 有 EXPLAIN 功能 ，INGRES 有 在 线 QEP 
查看 工具 。 当 查询 运行 比 期 望 的 慢 时 ， 便 可 以 用 这 类 工具 检查 慢 的 原因 ， 找 出 可 能 提高 查询 
效率 的 可 选 策略 。 

如 果 有 大 量 的 元 组 要 捅 人 某 个 具有 一 个 或 者 多 个 索引 的 关系 中 ， 可 以 先 删 除 索 引 ， 执 行 
插入 操作， 然后 再 重新 创建 索引 ， 这 样 执行 效率 会 高 一 些 。 经 验 表 明 ， 如 果 插 和 人 操作 将 使 关 
系 的 大 小 增加 至 少 10%， 就 应 该 临时 性 地 删除 索引 。 

更 新 数据 库 的 统计 数据 

查询 优化 机 制 根 据 系统 目录 中 存储 的 数据 库 的 统计 值 来 选择 最 佳 执行 策略 。 不 论 什 么 时 
RUER, DBMS 都 会 自动 将 当前 索引 加 入 系统 目录 。 我 们 可 能 会 发 现 DBMS 需要 一 个 
程序 来 更 新 系统 目录 中 与 关系 和 索引 相关 的 统计 值 。 

用 文档 记录 索引 的 选择 

应 该 用 文档 记录 下 对 索引 的 选择 及 选择 原因 。 特 别 是 当 某 些 属性 因为 性 能 的 原因 而 不 能 
建立 索引 时 ， 尤 其 要 进行 详细 记录 。 

在 Microsoft Access 中 实现 DreamHome 的 文件 组 织 和 索引 
像 大 多 数 (如 果 不 是 所 有 的 ) PC 上 的 DBMS 一 样 ，Microsoft Office Access 使 用 一 种 固定 
的 文件 组 织 方式 。 因 此 ， 如 果 目 标 DBMS Æ Microsoft Office Access， 则 可 以 省 略 步 又 4.2。 
但 是 Microsoft Office Access 支持 我 们 正在 讨论 的 索引 。 在 本 节 中 ， 我 们 使 用 Access 的 术 
语 ， 将 关系 称 为 一 个 包含 了 字段 和 记录 的 表 。 
建立 索引 指南 。 在 Access 中 ， 一 个 表 的 主 关键 字 是 自动 被 索引 的 ， 但 是 数据 类 型 为 
Memo, Hyperlink 或 者 OLE 对 象 的 字段 则 不 能 被 索引 。 对 于 其 他 字段 ， 若 满足 下 面 所 有 条 
(+, Microsoft 建议 为 其 建立 索引 : 
© 该 字段 的 数据 类 型 是 Text, Number, Currency 或 者 Date/Time。 
e 用 户 期 望 对 存储 在 该 字段 中 的 值 进行 搜索 。 
e 用 户 期 望 对 该 字段 中 的 值 进行 排序 。 
e 用 户 期 望 在 该 字段 中 存储 许多 不 同 的 值 。 如 果 该 字段 的 很 多 值 重 复出 现 ， 那 么 即使 
对 该 字段 建立 索引 也 不 会 大 幅度 地 提高 查询 速度 。 

另外 ，Microsoft 还 建议 : 

e 在 连接 操作 两 边 的 连接 字段 上 都 建立 索引 ， 或 者 创建 这 些 字 段 之 间 的 一 个 联系 ， 此 
时 ， 如 果 在 外 部 关键 字 字 段 上 还 没有 建立 索引 的 话 ，Microsoft Office Access 会 自动 
索引 外 部 关键 字 。 

e 当 根 据 连 接 字 段 的 值 对 记录 进行 分 组 时 ，GROUP BY 子 句 中 的 字段 要 与 聚集 函数 计 
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算 的 字段 在 同一 个 关系 里 。 
Microsoft Office Access 可 以 对 简单 和 复杂 的 谓词 (在 Access 中 称 为 表达 式 ) 进行 优化 。 
对 于 某 种 特定 类 型 的 复杂 表达 式 ，Microsoft Office Access 使 用 一 种 称 为 乱 序 流 ( rushmore) 
的 数据 访问 技术 ， 实 现 更 高 层次 的 优化 。 复 杂 表 达 式 由 两 个 简单 表达 式 通过 AND 或 OR 运 


branchNo = ‘BOO!’ AND rooms > 5 
type = ‘Flat’ OR rent > 300 


在 Office Access 中 ， 复 杂 表 达 式 可 以 被 部 分 优化 还 是 完全 优化 ， 一 方面 依赖 于 两 个 简 
单 表 达 式 是 否 都 能 够 被 优化 ， 另 一 方面 还 依赖 于 连接 两 个 简单 表达 式 的 运算 符 是 什么 。 当 下 
面 的 三 个 条 件 都 满足 时 ， 可 以 对 一 个 复杂 的 表达 式 进 行 乱 序 流 优化 : 

e 表达 式 以 AND 或 OR 连接 两 个 条 件 。 

e 两 个 条 件 都 由 简单 的 可 优化 的 表达 式 组 成 。 

e 两 个 表达 式 都 包含 索引 字段 。 这 些 字段 可 以 是 单独 索引 的 或 者 是 作为 复合 索引 的 一 部 分 。 

DreamHome 的 索引 。 在 创建 愿望 表 之 前 ,我 们 将 忽略 所 有 小 表 ， 因 为 小 表 通 常 可 以 全 
部 放 在 内 存 中 而 不 需 增 加 额外 的 索引 。 对 于 DreamHome， 我 们 忽略 对 表 Branch, Telephone, 
Manager 和 Newspaper 的 考虑 。 基 于 上 述 指南 ， 我们 可 以 知道 : 

(1) 为 每 个 表 创 建 主 关键 字 ， 同 时 Office Access 会 自动 为 该 字段 创建 索引 。 

(2) 确保 在 Relationships (联系 ) 窗口 中 创建 所 有 联系 ， 这 样 Office Access 会 自动 为 外 

部 关键 字 创 建 索 引 。 

至 于 要 创建 的 其 他 索引 ， 我 们 考虑 在 附录 A 中 列 出 的 DreamHome 的 StaffClient 用 户 视 
图 中 的 查询 事务 。 表 18-2 给 出 了 基本 表 和 这 些 事务 相互 作用 的 情况 。 该 图 针对 每 个 表 显 示 
了 操作 该 表 的 事务 、 访 问 类 型 (基于 谓词 的 搜索 、 基 于 连接 字段 的 连接 操作 、 对 字段 排序 、 
对 字段 分 组 ) 以 及 事务 执行 的 频率 。 


表 18-2 DreamHome 的 StaffClient 视图 中 基本 表 与 查询 事务 的 相互 关系 


z IA 
ay" à 
) 连接 关系 : Staff a 
Staff 4 连接 属性 : supervisorStaffNo 
20 
连接 关系 : Staff 
nace (e) porch 1000 ~ 2000 
ar “i 
连接 关系 ，PrivateOwner/BusinessOwner 
(c) 连接 属性 : ownerNo 5000 10000 
PropertyForRent 
d) 连接 关系 : Staff af 
i 连接 属性 : staffNo 
= 
= 
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( 续 ) 


eB 


连接 关系 : Client 
PropertyForRent 连接 属性 :clientNo 100 


连接 关系 : Client 


View; l 
iewing 连接 属性 : clientNo ý 


连接 关系 : PropertyForRent Pr 
连接 属性 : propertyNo S00 0000 
ee cand 





Lease 连接 关系 : PropertyForRent 


连接 属性 : propertyNo 
连接 关系 : Client 连接 关系 : clientNo 1000 


基于 这 些 信 息 ， 我 们 创建 了 其 他 索引 ， 见 表 18-3。 我 们 把 这 部 分 内 容 作 为 练习 (参见 习 
题 18.5 )， 请 读者 针对 附录 A 中 列 出 的 DreamHome 的 Branch 视图 的 事务 在 Microsoft Office 
Access 中 有 选择 性 地 创建 索引 。 
在 Oracle 中 实现 DreamHome 的 文件 组 织 和 索引 

这 一 节 ， 我 们 将 重复 上 面 为 DreamHome 表 18.3 在 microsoft Office Access 中 基于 Dream- 
的 StaffClient 视图 确定 适当 的 文件 组 织 方 Home 的 StaffClient 视图 的 查询 事务 创建 的 索引 
式 和 索引 的 过 程 ， 并 使 用 Oracle DBMS 的 术 
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语 ， 称 关系 为 一 个 具有 行 和 列 的 表 。 R RO l 
Oracle 数据 库 会 目 动 为 每 一 个 主 关 键 字 Staff chine ame 
建立 索引 。 另 外 ，Oracle 建议 不 在 表 中 显 式 i position 
定义 UNIQUE 索引 ， 而 是 在 相应 的 列 中 定 ” A Pame News 
X UNIQUE 的 完整 性 约束 。Oracle 通常 在 on a 
PropertyForRent city 


具有 唯一 性 约束 的 关键 字 上 自动 定义 唯一 索 
引 ， 以 此 强制 实现 UNIQUE 的 完整 性 约束 。 
因为 性 能 的 缘故 ， 也 有 例外 情况 存在 。 例 如 ， 执 行 CREATE TABLE...AS SELECT 语句 时 ， 
若 语句 中 定义 了 UNIQUE 约束 ， 则 该 语句 的 执行 速度 要 比 先 创建 一 个 没有 UNIQUE 约束 的 
表 然 后 再 手工 创建 UNIQUE 索引 的 方式 慢 。 

假设 在 创建 表 时 就 已 经 指定 了 主 关键 字 、 候 选 关 键 字 和 外 部 关键 字 。 我 们 现在 要 确定 是 
否 还 需要 聚集 和 其 他 索引 。 为 了 使 设计 简单 化 ， 假 设 在 这 里 创建 聚集 并 不 合适 。 同 样 Ri 
也 只 需要 考虑 附录 A 中 列 出 的 DreamHome 的 StaffClient 视图 的 查询 事务 ， 那 么 添加 表 18-4 
中 的 索引 就 可 以 使 性 能 得 到 提高 。 同 样 作为 练习 (参见 习题 18.6 )， 请 读者 针对 附录 A 中 列 
出 的 DreamHome 的 Branch 视图 的 事务 在 Oracle 中 创建 索引 。 


表 18-4 在 Oracle 中 基于 DreamHome 的 Staff 视图 的 查询 事务 创建 的 索引 
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步骤 4.4 ”估计 所 和 需 的 磁盘 空间 
| 目标 | 估计 数据 库 所 需 的 磁盘 空间 。 


数据 库 的 物理 实现 可 能 会 受制 于 当前 的 硬件 配置 。 即 使 不 会 受到 硬件 配置 的 限制 ， 设 
计 者 仍然 需要 估算 存储 数据 库 所 需 的 磁盘 空间 大 小 ， 确 定 是 否 需 要 更 新 便 件 。 步 又 4.4 的 
目标 是 估计 支持 数据 库 物 理 实现 所 需 的 二 级 存储 带 的 磁盘 空间 大 小 。 像 前 述 步 又 一 样 ， 磁 
盘 空 间 需 求 大 小 的 估计 高 度 依赖 于 目标 DBMS 以 及 支撑 数据 库 的 硬件 。 一 般 来 说 ， 对 磁 
盘 空 间 大 小 的 估计 依赖 于 关系 中 每 个 元 组 的 大 小 和 元 组 数目 的 多 少 。 对 元 组 的 个 数 的 佑 计 
应 该 取 其 可 能 的 最 大 值 ， 另 外 ， 考 虑 将 来 关系 大 小 的 变化 也 很 有 必要 ， 可 以 根据 关系 大 小 
的 变化 修改 对 所 需 磁盘 空间 的 估计 ， 并 以 此 确定 未 来 数据 库 可 能 需要 的 磁盘 空间 的 大 小 。 
附录 丁 ( 人 参见 本 书 的 Web 网 站 ) 给 出 了 在 Oracle 中 如 何 对 所 创建 的 关系 的 大 小 进行 评估 的 
过 程 。 


步骤 5 设计 用 户 视图 
| 目标 | 根据 数据 库 系 统 开发 生命 周期 的 需求 收集 和 分 析 阶 段 产生 的 信息 设计 用 户 视图 。 


在 第 16 章 中 讲述 的 数据 库 设 计 方 法 学 中 ， 第 一 步 就 是 为 数据 库 分 析 阶 段 定 义 的 一 个 或 
者 多 个 视图 创建 局 部 概念 数据 模型 。 在 11.4.4 节 中 我 们 为 DreamHome 确定 了 5 个 用 户 视 
图 ， 分 别 为 Director, Manager, Supervisor, Assistant 和 Client， 根 据 对 这 些 视图 的 数据 需 
求 的 分 析 ， 我 们 使 用 集中 的 方法 将 这 些 用 户 视 图 合并 为 : 

e Branch: 包括 Director 和 Manager 用 户 视 图 。 

e StaffClient: 包括 Supervisor, Assistant 和 Client 用 户 视图 。 

在 步骤 2 中 ， 概 念 数据 模型 被 映射 为 逻辑 数据 模型 (关系 模型 )。 步 又 5 的 目的 就 是 设 
计 实 现 前 面 已 经 确定 的 用 户 视图 。 对 可 以 独立 运行 在 PC 上 的 DBMS 来 说 ， 用 户 视图 通常 是 
为 了 简化 数据 库 需 求 、 方 便 用 户 使 用 而 设计 的 。 但 是 在 一 个 多 用 户 的 DBMS 中 ， 用 户 视图 
则 在 定义 数据 库 的 结构 和 强化 安全 措施 方面 起 着 重要 作用 。 在 7.4.7 节 中 我 们 讨论 了 用 户 视 
图 的 主要 优点 ， 如 数据 独立 性 、 降 低 复杂 度 和 用 户 化 定制 等 。 我 们 在 前 面 已 经 讨论 了 如 何 使 
用 ISO SQL 标准 创建 视图 (参见 7.4.1 节 )， 以 及 如 何在 Microsoft Office Access (参见 本 书 
的 Web 网 站 上 的 附录 M) 创建 视图 (被 存储 查询 )。 

用 文档 记录 用 户 视图 的 设计 
将 每 个 用 户 视图 的 设计 都 记录 在 文档 中 。 


步骤 6 设计 安全 机 制 


目标 | 为 数据 库 设计 安全 机 制 ， 这 些 安全 性 需求 是 在 数据 库 系统 的 开发 生命 周期 的 需求 收 
集 和 分 析 阶 段 由 用 户 指定 的 。 


数据 库 代 表 了 整个 企业 的 重要 资源 ， 因 此 数据 库 资 源 的 安全 性 非常 重要 。 在 数据 库 系 
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统 开 发 生命 周期 的 需求 收集 和 分 析 阶 段 ， 应 该 已 经 将 用 户 列 出 的 安全 需求 用 文档 记录 在 系统 
需求 规格 说 明 书 中 (参见 11.4.4 节 )。 步 骤 6 的 目标 是 如 何 实现 这 些 安全 需求 。 有 些 系 统 支 
持 的 安全 机 制 比 其 他 系统 更 为 方便 。 同 样 ， 数 据 库 设计 者 必须 熟悉 目标 DBMS 的 安全 机 制 。 
正如 将 在 第 20 章 中 讨论 的 那样 ， 关 系 DBMS 一 般 支 持 两 种 类 型 的 数据 库 安全 : 

© 系统 安全 

e 数据 安全 

系统 安全 适用 于 系统 层 数据 库 的 访问 和 使 用 ， 如 用 户 名 和 密码 等 。 数 据 安全 则 适用 于 
用 户 对 数据 库 对 象 ( 如 关系 和 视图 ) 的 访问 、 使 用 以 及 用 户 可 以 对 这 些 对 象 进 行 的 操作 。 同 
样 ， 访 问 规则 的 设计 依赖 于 目标 DBMS， 与 其 他 系统 相 比 ， 某 些 系 统 支 持 的 访问 规则 的 设 
计 机 制 更 为 便利 。 前 面 我 们 已 经 讨论 了 如 何 使 用 ISO SQL 标准 中 的 GRANT 和 REVOKE 语 
句 自主 创建 访问 规则 (参见 7.6 节 )。 也 说 明了 在 Microsoft Office Access (参见 附录 H.1.9 ) 
和 Oracle (参见 附录 H.2.5 节 ) 中 如 何 创 建 访问 规则 。 我 们 将 在 第 20 章 对 安全 进行 更 全 面 的 
讨论 。 
用 文档 记录 安全 机 制 的 设计 

用 文档 记录 对 安全 机 制 的 设计 。 如 果 物 理 设 计 会 影响 逻辑 数据 模型 ， 则 逻辑 数据 模型 也 
要 进行 相应 的 修改 。 


本 章 小 结 

© 物理 数据 库 设 计 是 在 二 级 存储 右上 实现 数据 库 描述 的 过 程 ， 这 些 描 述 包括 基础 关系 、 文 件 组 织 、 为 
实现 数据 的 高 效 访问 而 建立 的 索引 、 相 关 的 完整 性 约束 以 及 安全 策略 。 只 有 在 设计 者 完全 熟悉 目标 
DBMS 提供 的 工具 后 方 可 进行 基础 关系 的 设计 。 

© 物理 数据 库 设 计 的 初始 步骤 (步骤 3 ) 是 将 逻辑 数据 模型 转化 为 能 够 在 目标 关系 DBMS 上 实现 的 

e 步骤 4 负责 设计 与 存储 基础 关系 相关 的 文件 组 织 方 式 和 访问 方法 。 包 括 : 对 将 在 数据 库 上 运行 的 事 
务 的 分 析 ， 基 于 这 些 分 析 选 择 合适 的 文件 组 织 方式 ， 选 择 索 引 ， 最 后 估计 物理 实现 时 所 需 的 磁盘 空 
间 大 小 。 

© 辅 索引 是 一 种 可 以 为 基础 关系 确定 另外 的 、 用 于 高 效 检索 数据 的 关键 字 的 机 制 。 维 护 和 使 用 辅 索引 
会 带 来 一 定 的 开销 ， 而 利用 辅 索引 检索 数据 时 性 能 会 得 到 提高 ， 因 此 需要 在 两 者 之 间 进 行 权 衡 。 

© 为 关系 选择 文件 组 织 方式 的 一 种 方法 是 保持 元 组 的 无 序 ， 并 按 需 要 创建 足够 多 的 辅 索引 。 男 一 种 方法 

是 将 关系 中 的 元 组 按照 指定 主 关键 字 或 建立 的 聚集 索引 进行 排序 。 为 要 建立 索引 的 候选 属性 建立 一 

个 “愿望 表 ”， 然 后 检测 保留 每 一 个 索引 对 系统 的 影响 ， 这 是 帮助 我 们 确定 所 需 辅 索引 的 方法 之 一 。 

步骤 5 的 目标 是 设计 早 在 需求 收集 和 分 析 阶 段 已 确定 的 用 户 视 图 的 实现 方法 ， 如 使 用 SQL 提供 的 

机 制 等 。 

e 数据 库 代 表 着 一 个 单位 的 重要 资源 ， 因 此 该 资源 的 安全 性 极其 重要 。 步 又 6 的 目标 是 设计 需求 收集 
和 分 析 阶 段 定义 的 安全 机 制 的 实现 方法 。 


思考 题 

18.1 说 明 概念 数据 库 设计 、 逻 辑 数据 库 设计 和 物理 数据 库 设计 的 区 别 ， 为 什么 这 些 任务 可 能 需要 由 
不 同 的 人 来 完成 ? 

18.2 ”描述 物理 数据 库 设 计 的 输入 和 输出 。 
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18.3，” 摘 述 本 章 物 理 数 据 库 设计 方法 学 中 各 主要 步骤 的 目标 。 
18.4 讨论 何 时 索引 会 提高 系统 的 效率 。 


习题 

DreamHome 案例 研究 

18.5 在 步骤 4.3 中 ， 我 们 针对 附录 A 中 列 出 的 DreamHome 的 StaffClient 用 户 视 图 的 查询 事务 在 
Microsoft Office Access 中 选择 并 创建 了 索引 。 请 在 Microsoft Office Access 中 针对 附录 A 中 列 
出 的 DreamHome 的 Branch 用 户 视图 的 查询 事务 选择 并 创建 索引 。 

18.6 LI Oracle 为 目标 DBMS ， 重 新 完成 习题 18.5。 

18.7 基于 你 所 熟悉 的 DBMS， 为 DreamHome 案例 研究 的 逻辑 设计 (参见 第 17 章 ) 创建 物理 数据 库 
设计 。 

18.8 “实现 习题 18.7 中 创建 的 物理 设计 。 

University Accommodation Office 案例 研究 

18.9 基于 习题 17.10 创建 的 逻辑 数据 模型 ， 用 你 所 熟悉 的 DBMS， 为 University Accommodation 
Office 案例 研究 (参见 附录 B.1 ) 创建 物理 数据 库 设 计 。 

18.10 根据 习题 18.9 创建 的 物理 设计 实现 University Accommodation Office 数据 库 。 

EasyDrive School of Motoring 案例 研究 

18.11 基于 习题 17.11 中 创建 的 逻辑 数据 模型 ， 用 你 所 熟悉 的 DBMS 为 EasyDrive School of Motoring 

案例 研究 (参见 附录 B.2 ) 创建 物理 数据 库 设 计 。 

18.12 根据 习题 18.11 中 创建 的 物理 设计 实现 EasyDrive School of Motoring 数据 库 。 

Wellmeadows Hospital 案例 研究 

18.13 ”基于 习题 17.13 中 创建 的 逻辑 数据 模型 ， 用 你 所 熟悉 的 DBMS ， 为 Wellmeadows Hospital 案例 

研究 (参见 附录 B.3 ) 创建 物理 数据 库 设计 。 
18.14 根据 习题 18.13 中 创建 的 物理 设计 实现 Wellmeadows Hospital 数据 库 。 
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方法 学 一 一 运行 时 系统 的 监控 与 调 优 








本 章 目标 
本 章 我 们 主要 学 习 : 
o 逆 规 范 化 的 意义 
利用 逆 规 范 化 提高 系统 性 能 的 时 机 
对 运行 时 系统 进行 监控 和 调 优 的 重要 性 
如 何 衡量 效率 
系统 资源 是 如 何 影 响 性 能 的 


本 章 我 们 讨论 并 用 实例 说 明 关 系数 据 库 的 物理 数据 库 设 计 方 法 学 的 最 后 两 个 步 又， 给 
出 何 时 需 对 逻辑 数据 模型 进行 逆 规 范 化 的 处 理 和 引入 宛 余 的 指导 原则 ， 最 后 讨论 对 运行 时 系 
统 进行 监控 和 调 优 的 重要 性 。 为 了 使 讨论 更 加 清晰 明了 ， 我 们 在 多 处 都 给 出 了 物理 实现 的 
aA o 


19.1 逆 规 范 化 与 可 控 元 余 的 引入 
步骤 7 考虑 引入 可 控 元 余 
| 目标 | 确定 是 否 需 要 通过 放宽 规范 化 要 求 ， 引 入 可 控 宛 余 以 提高 系统 效率 。 


规范 化 过 程 (参见 第 14、15 章 ) 决定 了 哪些 属性 应 该 放 在 同一 个 关系 中 。 关 系数 据 库 
设计 的 基本 目标 之 一 就 是 将 属性 按 函 数 依赖 分 组 ， 从 而 生成 一 个 一 个 的 关系 。 规 范 化 的 结果 
是 一 个 结构 上 一 致 并 且 拥 有 最 少 宛 余 的 逻辑 数据 库 设 计 。 然 而 ， 有 观点 认为 ， 规 范 化 的 数据 
库 设 计 并 不 能 提供 最 大 的 处 理 效 率 。 因 此 ， 在 某 些 情况 下 ， 为 了 性 能 的 提高 而 有 必要 考虑 放 
弃 完 全 规范 化 带 来 的 好 处 。 这 也 仅 在 估计 系统 不 能 满足 性 能 需求 时 才 考 虑 。 我 们 不 是 提倡 
将 规范 化 过 程 从 逻辑 数据 库 设计 中 去 除 : 规范 化 过 程 强迫 设计 者 理解 数据 库 中 每 一 个 属性 
所 代表 的 意思 。 这 可 能 是 关系 整个 系统 成 功 与 否 的 最 重要 的 因素 。 另 外 ， 我 们 还 要 考虑 下 列 
因素 : 

e 逆 规 范 化 会 使 实现 变 得 更 加 复杂 。 

e 逆 规 范 化 通常 会 降低 灵活 性 。 

© 道 规范 化 会 加 快 检索 的 速度 ,但 却 会 降低 更 新 的 速度 。 

从 形式 上 看 ， 逆 规范 化 ( denormalization) 是 指 对 关系 模式 的 精 化 ， 使 得 修改 后 至 少 有 
一 个 关系 的 规范 化 程度 低 于 原 关 系 的 规范 化 程度 。 我 们 也 常用 这 个 术语 指 代 将 两 个 关系 合并 
为 一 个 新 关系 的 情形 ， 新 生成 的 关系 仍然 是 规范 化 的 ,但 与 原 关 系 相 比 则 含有 更 多 的 空 日 
项 。 有 些 人 将 逆 规 范 化 称 为 使 用 精 化 〈usage refinement). 

通常 的 经 验 是 ， 如 果 系 统 性 能 不 太 令 人 满意 ， 并 且 关 系 具 有 和 较 低 的 修改 率 和 较 高 的 查询 
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率 ， 逆 规范 化 就 可 能 是 一 种 可 行 的 改进 方案 。 在 步骤 4.1 中 创建 的 事务 /关系 交叉 引用 和 矩阵， 
为 本 步骤 提供 了 有 用 的 信息 。 该 矩阵 以 可 视 化 的 方式 给 出 了 将 要 运行 于 数据 库 上 的 事务 的 访 
间 模 式 。 可 以 根据 这 些 信 息 找 到 要 进行 道 规范 化 的 候选 关系 ， 同 时 还 能 够 对 逆 规 范 化 操作 对 
模型 中 其 他 部 分 可 能 带 来 的 影响 进行 评估 。 

更 具体 地 说 ， 该 步骤 考虑 复制 某 些 属性 或 者 将 某 些 关系 连接 起 来 ， 以 减少 执行 查询 时 所 
需 进行 的 连接 操作 。 例 如 ， 在 处 理 地 址 属性 时 ， 我 们 将 间接 地 碰 到 逆 规 范 化 的 问题 。 考 虑 关 
系 Branch 的 定义 : 

Branch (branchNo, street, city, postcode, mgrStaffNo) 


严格 地 说 ， 该 关系 不 是 第 三 范式 的 : postcode (邮政 编码 ) 函数 决定 city. MA, A 
定 属性 postcode 的 一 个 值 ， 便 可 以 确定 属性 city 的 一 个 值 。 因 此 ， 关 系 Branch 是 第 二 范 
式 (2NF) 的 。 若 将 该 关系 规范 化 为 第 三 范式 (3NF)， 则 有 必要 将 该 关系 分 解 成 两 个 ,如 下 
所 示 : 

Branch (branchNo, street, postcode, mgrStaffNo) 

Postcode (postcode, city) 

但 是 ， 我 们 很 少 会 访问 没有 city 属性 的 分 公司 地 址 。 这 意味 着 无 论 何 时 ， 当 我 们 需要 某 
分 公司 完整 地 址 信息 的 时 候 ， 都 需要 执行 一 个 连接 操作 。 因 此 ， 我 们 仍 应 选择 第 二 范式 的 方 
案 ， 即 选择 实现 原 关 系 Branch。 

遗憾 的 是 ， 并 不 存在 一 种 固定 的 规则 来 确定 什么 时 候 应 该 对 关系 进行 逆 规 范 化 。 在 步 又 
7 中 ,我们 讨论 几 种 常见 的 需要 考虑 逆 规 范 化 的 情况 。 而 其 他 的 信息 ， 感 兴趣 的 读者 可 以 参 
见 Rogers (1989) 和 Fleming and Von Halle ( 1989 )。 具 体 来 说 ,一 般 考虑 下 列 道 规范 化 的 
情况 ， 尤 其 是 在 可 以 加 速 执行 那些 频繁 或 者 关键 的 事务 时 : 

步骤 7.1 “合并 一 对 一 (1:1) 联系 

步骤 7.2 在 一 对 多 (1:*) 联系 中 复制 非 关 键 字 属性 以 减少 连接 操作 

步骤 7.3 在 一 对 多 (1:*) 联系 中 复制 外 部 关键 字 属 性 以 减少 连接 操作 

步骤 7.4 在 多 对 多 (*:*) 联系 中 复制 属性 以 减少 连接 操作 

步骤 7.5 引入 重复 组 

步骤 7.6 创建 抽取 表 

GRIT 对 关系 进行 分 割 

为 了 阐明 这 些 步 又， 使 用 图 19-1a 中 的 关系 图 和 图 19-1b 中 的 示例 数据 。 
FMT 合并 一 对 一 (1 :1) 联系 

重新 分 析 一 对 一 (1 : 1 ) 的 联系 ,分 析 将 两 个 关系 合并 为 一 个 关系 后 的 效果 。 如 果 两 个 
关系 经 常 被 一 起 访问 并 且 很 少 被 单独 访问 ， 那 就 应 该 考虑 合并 了 。 例 如， 考虑 如 图 19-1 所 
示 的 关系 Client 和 Interview 的 1 : 1 的 联系 。 关 系 Client 存储 了 可 能 成 为 租房 人 的 信息 ， 关 
系 Interview 则 包含 了 公司 员工 与 Client 会 谈 的 日 期 以 及 对 Client 的 评价 信息 。 

我 们 可 以 将 这 两 个 关系 合并 成 一 个 新 的 关系 ClientInterview, 41 19-2 ta. Bi 
然 Client 和 Interview 之 间 的 联系 是 1:1 的 ,并 且 是 可 选 参与 ,那么 合并 之 后 的 关系 
ClientInterview 中 就 可 能 存在 大 量 的 空白 项 ， 这 和 参与 元 组 的 比例 有 关 ， 如 图 19-2b fra. 
如 果 原 关系 Client 很 大 并 且 参 与 此 1 :1 联系 的 元 组 的 比例 很 小 ， 那 么 将 会 造成 大 量 的 空 
间 浪 费 。 
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clientNo {PK, FK} | 9--1 1..1 clientNo {PK} 
fName 
IName 


staffNo 


datelnterview 
comment 


telNo 
preflype 
maxRent 
eMail 





1..1 


Requests 
y 
Oas 


clientNo {PK, FK} telNo {PK} 
propertyNo {PK, FK} branchNo {FK} 
1..3 








viewDate 
comment 
A 
A Provides 
Takes 
ve 1.3 
ownerNo {PK} . 1 | propertyNo {PK} |1 1..1| branchNo {PK} 
fName street street 
IName city city 
address postcode postcode 
telNo type 
rooms 
rent 
ownerNo {FK} 
staffNo 
branchNo {FK} 
a) 关系 图 示例 
Branch Telephone 
ree foro [ey [roids 











22 Deer Rd 
16 Argyll St 
163 Main St 
32 Manse Rd 
56 Clover Dr 


0207-886-1212 
0207-886-1300 
0207-886-4100 
01224-67125 
0141-339-2178 
0141-339-4439 
0117-916-1170 
0208-963-1030 



















AB2 3SU 
G11 9QX 
BS99 INZ 
NW10 6EU 






















PropertyForRent 










Aberdeen 
London 


16 Holhead 
6 Argyll St 
6 Lawrence St 
2 Manor Rd 
18 Dale Rd 
5 Novar Dr 


AB7 5SU 
NW2 

G11 9QX 
G32 4QX 
G12 
G12 9AX 














Glasgow 
Glasgow 
Glasgow 









Glasgow 













john.kay@gmail.com 
astewart@hotmail.com 

mritchie01@yahoo.co.uk 
maryt@hotmail.co.uk 


















11-Apr-12 
7-Mar-12 


current lease ends in June 
needs property urgently 





0141-357-7419 
0141-943-1728 
0141-225-7025 






24-May-13 
20-Apr-13 
26-May-13 
14-May-13 
28-Apr-13 


too small 





too remote 










no dining room 
b) 关系 示例 
图 19-1 ( 续 ) 


Clientinterview 


clientNo {PK} 
fName 
IName 

telNo 
preflype 
maxRent 
eMail 

staffNo 
dateinterview 
comment 


a) 修改 从 关系 图 中 提取 出 来 的 部 分 





Clientinterview 


john. kay@gmail.com 


Stewart | 0141-848-1825 | Flat astewart@hotmail.com 11-Apr-12 current lease ends in June 
Ritchie | 01475-392178 | House mritchie0 1 @yahoo.co.uk 
Tregear | 01224-196720 | Flat maryt@hotmail.co.uk 5 7-Mar-12 needs property urgently 


b) 合并 而 成 的 关系 
图 19-2 合并 关系 Client 和 Interview 


BUR 7.2 在 一 对 多 (1:*) 联系 中 复制 非 关 键 字 属 性 以 减少 连接 操作 
为 了 减少 和 去 除 频 紧 执行 的 或 者 关键 查询 中 的 连接 操作 ， 考 虑 将 父 关系 的 一 个 或 者 多 个 
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非 关 键 字 属 性 复制 到 1 : * 联系 的 子 关 系 中 ， 这 样 做 也 许 会 带 来 好 处 。 例 如 ， 任何 时 候 在 访 
问 关系 PropertyForRent 的 同时 访问 业主 名 字 的 操作 很 常见 。 典 型 的 SQL 查询 为 : 


SELECT p.*, o.IName 
FROM PropertyForRent p, PrivateOwner o 
WHERE p.ownerNo = o.ownerNo AND branchNo = ‘B003’; 


基于 图 19-1 所 示 的 原 关 系 图 和 示例 关系 ， 如 果 将 属性 IName 复制 到 关系 PropertyForRent 
中 ， 那 么 可 以 将 关系 PrivateOwner 从 查询 中 去 除 ， 根 据 图 19-3 所 示 的 修改 后 的 关系 ，SQL 语 
句 就 变 成 : 

SELECT p.* 


FROM PropertyForRent p 
WHERE branchNo = ‘B003’; 


PropertyForRent 


16 Holhead 


6 Argyll St 
6 Lawrence St 


5 Novar Dr | Glasgow 





图 19-3 改变 后 的 PropertyForRent 关系 ， 具 有 从 PrivateOwner 关系 复制 来 的 IName 属性 


我 们 必须 在 如 此 修改 带 来 的 好 处 与 其 可 能 带 来 的 问题 之 间 进 行 权 衡 。 例 如 ， 如 果 复 制 
的 数据 在 父 关系 中 被 改变 了 ， 则 子 关 系 中 相应 的 数据 也 必须 跟着 改变 。 进 一 步 来 说 ， 对 于 一 
个 1:* 联 系 ， 子 关系 中 可 能 存在 某 个 数据 项 的 多 个 副本 (例如 ， 名 字 Farrel 和 Shaw 两 次 出 
现在 修改 之 后 的 关系 PropertyForRent 中 )， 我 们 必须 保持 多 个 数据 副本 之 间 的 一 致 性 。 如 果 
在 关系 PrivateOwner 和 PropertyForRent 中 ， 属 性 IName 的 值 不 能 被 自动 修改 ， 就 需要 考虑 
失去 数据 一 致 性 的 潜在 危险 了 。 因 复制 而 产生 的 一 个 相关 问题 是 每 当 一 个 元 组 被 插入、 修改 
或 者 删除 时 ， 会 带 来 维持 数据 一 致 性 的 额外 开销 。 在 上 例 中 ， 一 般 不 会 对 业主 的 名 字 进 行 修 
改 ， 因 此 复制 是 可 行 的 。 

另 一 个 需要 考虑 的 问题 是 因 复 制 所 带 来 的 存储 开销 。 由 于 现在 二 级 存储 器 的 价格 很 便 
宜 ， 这 可 能 不 是 一 个 很 重要 的 问题 。 但 是 ， 这 并 不 意味 着 可 以 随意 复制 。 

一 种 特殊 的 一 对 多 联系 (1 :*) 是 查看 表 (lookup table)， 有 时 候 也 叫 引 用 表 (reference 
table) 或 者 选择 表 (pick list)。 典 型 的 查看 表 一 般 包含 一 个 代码 属性 和 一 个 描述 属性 。 例 如 ， 
我 们 可 以 为 房产 类 型 定义 一 个 查看 表 (RA), HKHK PropertyForRent ( 子 关 系 ) 修改 为 
图 19-4 所 示 的 形式 。 使 用 查看 表 的 好 处 有 : 

© 了 减 小 子 关系 的 大 小 ; 代码 属性 只 占 1 个 字 节 ， 而 类 型 描述 需要 5 个 字 节 。 

e 如 果 描 述 可 能 被 修改 (在 本 例子 中 不 会 )， 则 只 需要 在 查看 表 中 修改 一 次 ， 而 不 需要 

在 子 关 系 中 修改 多 次 。 ; 

e 查看 表 可 以 用 来 检查 用 户 输入 的 有 效 性 。 

如 果 将 查看 表 用 于 频繁 执行 的 查询 或 者 关键 查询 中 ， 并 且 描 述 属性 一 般 不 会 被 修改 ， 则 
可 以 考虑 将 查看 表 的 描述 属性 复制 到 子 关 系 中 ， 如 图 19-5 所 示 。 原 来 的 查看 表 并 不 是 多 余 
的 ， 它 仍然 可 以 用 来 检查 用 户 输入 的 合法 性 。 但 是 在 子 关 系 中 复制 描述 属性 后 ， 查 询 就 不 再 
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需要 连接 子 关系 和 查看 表 了 了 。 


PropertyForRent 


propertyNo {PK} 
street 

city 

postcode 

type {FK} 
rooms 

rent 

ownerNo {FK} 
staffNo 
branchNo {FK} 









a) KAA 


OPW Typo 





PropertyForRent 


Se lo 


16 Holhead | Aberdeen | AB7 5SU 
6 Argyll St 

6 Lawrence St 

2 Manor Rd 

18 Dale Rd 

5 Novar Dr 





b) 关系 案例 
图 19-4 房产 类 型 的 查看 表 


Te 


PropertyForRent 


2 Manor Rd 
18 Dale Rd 
5 Novar Dr 


图 19-5 ”修改 后 的 包含 复制 的 描述 属性 的 PropertyForRent 关系 





步骤 7.3 在 一 对 多 (1:*) 联系 中 复制 外 部 关键 字 属 性 以 减少 连接 操作 
同样 ， 为 了 减 小 和 去 除 频 繁 执行 的 事务 或 者 关键 查询 中 的 连接 操作 ， 可 以 考虑 复制 关系 
中 的 一 个 或 者 多 个 外 部 关键 字 属 性 。 例 如 ，DreamHome 的 一 个 常用 查询 是 列 出 某 分 公司 管 
理 的 所 有 房产 业主 。 基 于 图 19-1 中 所 示 的 原始 数据 ， 该 查询 用 SQL 语句 可 以 表示 为 : 
SELECT o.IName 


FROM PropertyForRent p, PrivateOwner o 
WHERE p.ownerNo = o.ownerNo AND branchNo = ‘B003’; 


换 名 话说， 因为 不 存在 PrivateOwner 和 Branch 之 间 的 直接 联系 ， 所 以 为 了 得 到 业主 
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名 单 ， 不 得 不 利用 关系 PropertyForRent 获得 对 分 公司 编号 branchNo 的 访问 。 我 们 可 以 
在 关系 PrivateOwner 中 复制 外 部 关键 字 branchNo， 这 样 就 可 以 去 除 连 接 操 作 ， 即 在 关系 
Branch 和 PrivateOwner 之 间 增 加 一 个 直接 的 联系 。 基 于 图 19-6 的 修改 后 的 关系 图 和 关系 
PrivateOwner， 其 SQL 查询 可 以 简化 为 : 

SELECT o.IName 


FROM PrivateOwner o 
WHERE branchNo = ‘B003; 


如 果 进 行 了 这 样 的 修改 ， 则 必须 添加 步骤 2.2 中 曾 讨论 过 的 外 部 关键 字 的 一 致 性 约束 。 











PropertyForRent 


propertyNo {PK} 
branchNo {FK} 


A 
POwns 


ownerNo {PK} 
branchNo {FK} 


a) 修改 ( 简化) 了 的 关系 图 ， 包含 了 作为 外 部 关键 字 的 branchNo 


PrivateOwner 


« Offers 








Serves 
y 





2 Fergus Dr, Aberdeen AB2 7SX | 01224-861212 


6 Achray St, Glasgow G32 9DX | 0141-357-7419 
0141-943-1728 
0141-225-7025 


b) 修改 了 的 关系 PrivateOwner 
图 19-6 在 关系 PrivateOwner 中 复制 外 部 关键 字 branchNo 


然而 ， 如 果 某 个 业主 通过 多 个 分 公司 出 租房 产 ， 则 上 面 的 修改 不 可 行 。 在 这 种 情况 
下 ， 必 须 在 Branch 和 PrivateOwner 之 间 建 立 一 个 多 对 多 (*: *) 的 联系 。 还 要 注意 ， 关 系 
PropertyForRent 需要 属性 branchNo 的 原因 是 某 一 房产 可 能 还 没有 被 分 配给 某 个 员工 ， 这 在 
房产 刚刚 通过 代理 录入 时 最 有 可 能 发 生 。 如 果 关 系 PropertyForRent 没有 分 公司 编号 ， 就 必 
须 通过 关系 PropertyForRent 和 Staff 基于 属性 staffNo 的 连接 操作 来 找到 所 属 的 分 公司 。 原 
始 的 SQL 查询 语句 可 能 为 : 

SELECT o.IName 

FROM Staff s, PropertyForRent p, PrivateOwner o 

WHERE s:staffNo = p.staffNo AND p.ownerNo = o.ownerNo AND s.branchNo = ‘B003’; 

夺 要 从 上 述 查 询 中 去 掉 两 个 连接 操作 ， 则 最 好 的 实现 方法 是 建立 关系 PrivateOwner 和 
Branch 之 间 的 直接 联系 ， 并 在 关系 PrivateOwner 中 复制 外 部 关键 字 branchNo。 


步骤 7.4 在 多 对 多 (*:*) 联系 中 复制 属性 以 减少 连接 操作 
在 逻辑 数据 库 设 计 中 ， 我 们 将 每 个 多 对 多 联系 映射 为 了 三 个 关系 : 由 两 个 原始 实体 导出 
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两 个 关系 ， 男 一 个 新 关系 则 表示 两 个 实体 之 间 的 联系 。 但 是 现在 如 果 希 望 从 * :* 联系 中 提 
取信 息 ， 就 不 得 不 将 这 三 个 关系 连接 起 来 。 某 些 情况 下 ， 将 原 实 体 中 的 属性 复制 到 那个 中 间 
关系 中 ， 就 可 能 减少 参加 连接 操作 的 关系 的 个 数 。 

例如 ，Client 和 PropertyForRent 之 间 * : * 的 联系 就 可 以 引入 一 个 中 间 关 系 Viewing 来 
表示 。 考 虑 下 面 的 需求 ，DreamHome 的 销售 人 员 应 该 与 那些 看 过 房 但 还 未 进行 评价 的 客户 
联系 。 然 而 ， 销 售 人 员 在 与 客户 对 话 时 仅 需 房产 的 street 属性 。 根 据 图 19-1 所 示 的 关系 模型 
和 案例 数据 ， 所 需 的 SQL 查询 为 : 

SELECT p.street, c.*, v.viewDate 

FROM Client c, Viewing v, PropertyForRent p 

WHERE v.propertyNo = p.propertyNo AND c.clientNo = v.clientNo AND comment 

IS NULL; 

如 果 把 street 属性 复制 到 中 间 关 系 Viewing 中 ， 就 可 以 将 PropertyForRent 关系 从 查询 中 
去 掉 。 基 于 图 19-7 的 修改 后 的 关系 Viewing, SQL 查询 语句 变 为 : 

SELECT c.*, v.street, v.viewDate 


FROM Client c, Viewing v 
WHERE c.clientNo = v.clientNo AND comment IS NULL; 


Viewing 


16 Holhead 24-May-13 | too small 
6 Lawrence St | 20-Apr-13 | too remote 


6 Lawrence St | 26-May-13 
16 Holhead 14-May-13 | no dining room 
2 Manor Rd 28-Apr-13 





图 19-7 将 关系 PropertyForRent 的 属性 street 复制 到 关系 Viewing 中 


步骤 7.$S 引入 重 复 组 

因为 所 有 关系 都 必须 满足 第 一 范式 ， 所 以 重复 组 已 经 从 逻辑 数据 模型 中 去 反 了 。 重 复 
组 被 分 解 成 新 的 关系 ， 与 原 ( 父 ) 关系 形成 了 1: * 的 联系 。 有 时 候 ， 重 新 引入 重复 组 可 
以 有 效 地 提高 系统 性 能 。 例 如 ，DreamHome 中 虽然 不 是 所 有 的 分 公司 都 有 相同 个 数 的 电话 
号 码 ， 但 每 个 分 公司 最 多 可 有 三 个 电话 号 码 。 在 前 述 的 逻辑 数据 模型 中 ， 我 们 创建 了 实体 
Telephone， 它 与 Branch 之 间 形 成 三 对 一 (3:1) 的 联系 ， 并 且 转 换 为 图 19-1 所 示 的 两 个 
KF o 

如 果 对 这 些 信息 的 查询 很 重要 或 者 执行 频率 很 高 ， 则 可 以 将 这 两 个 关系 合并 起 来 ， 在 
原来 的 Branch 关系 中 存储 电话 的 详细 信息 ， 即 将 每 个 电话 号 人 码 作为 一 个 属性 (如 图 19-8 所 
示 )， 效 率 可 能 更 高 。 

一 般 来 说 ， 在 下 面 的 情况 下 可 以 考虑 这 种 逆 规 范 化 : 

e 重复 组 中 项 的 绝对 数目 是 已 知 的 〈 在 这 个 例子 中 ， 最 多 有 三 个 电话 号 码 )。 

e 该 数目 是 静态 的 ， 不 会 随 着 时 间 的 改变 而 改变 (最 多 的 电话 号 人 码 个 数 是 固定 的 ， 且 

不 希望 被 改变 )。 
e 该 数目 不 是 很 大 ， 一 般 不 会 超过 10， 尽 管 比 起 前 两 个 条 件 来 这 显得 并 不 十 分 重要 。 
有 了 时候 ， 在 一 个 重复 组 中 经 常 被 访问 的 可 能 只 有 最 近 的 或 当前 的 值 ， 或 者 只 有 某 一 重 
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复 组 经 常 被 访问 。 例 如 ， 在 上 面 的 例子 中 ， 我们 可 以 选择 在 关系 Branch 中 只 存储 一 个 电话 ， 
而 将 其 他 的 号 码 存 储 在 关系 Telephone 中 。 这 将 会 去 除 关系 Branch 中 的 空白 项 ， 因 为 每 个 
分 公司 至 少 有 一 个 电话 号 码 。 


branchNo {PK} 
street 











22 Deer Rd 0207-886-1212 | 0207-886-1300 | 0207-886-4100 


city 16 Argyll St 01224-67125 
postcode 163 Main St 0141-339-2178 | 0141-339-4439 
telNo1 {AK} . 


32 Manse Rd i 0117-916-1170 
56 Clover Dr | London | NW106EU | 0208-963-1030 


a) 修改 后 的 关系 图 b) 修改 后 的 关系 
图 19-8 ”分 公司 合并 重复 组 


telNo2 
telNo3 





步骤 7.6 创建 抽取 表 
有 些 时 候 可 能 需要 在 日 天 的 峰值 时 刻 运 行 报表 程序 。 这 些 报表 程序 可 能 会 访问 某 些 导出 
数据 ， 并 要 在 同一 组 基础 关系 上 运行 涉及 了 多 个 关系 的 连接 操作 。 但 是 ， 报 表 所 需要 的 数据 
可 能 是 相对 静止 的 ， 或 者 在 某 些 情况 下 可 以 不 必 是 当前 的 (也 就 是 说 ， 即 使 是 几 个 小 时 之 前 
的 数据 ， 报 表 也 是 完全 可 以 接受 的 )。 在 这 种 情况 下 ， 可 能 需要 基于 报表 所 需 的 关系 创建 一 
个 独立 的 、 高 度 逆 规 范 化 的 抽取 表 ， 用 户 可 以 直接 访问 抽取 表 ， 而 不 必 访 问 基 础 关系 。 常 用 
的 创建 抽取 表 的 方法 是 ， 在 系统 负载 较 轻 时 
批量 创建 并 装载 这 些 表 。 
步骤 7.7 对 关系 进行 分 割 sass 
相 比 关系 的 合并 ， KART Fe OT RE 国 。 
大 关系 (和 索引 ) 的 支持 问题 ， 即 将 关系 分 ES 
割 为 多 个 小 一 些 的 更 好 管理 的 被 称 为 分 割 
(partition) 的 片段 。 关 系 的 分 割 一 般 分 为 两 i 
类 .水平 分割 和 垂直 分 割 ， 如 图 19-9 所 示 。 图 19-9 水 平分 割 和 垂直 分 割 


| 水 平分 割 | 关系 的 元 组 被 分 布 到 多 个 (小 一 些 的 ) 关系 中 。 


垂直 分 割 | 关系 的 属性 被 分 布 到 多 个 (小 一 些 的 ) KAP ( 主 关键 字 被 复制 到 各 个 关系 中 ， 
以 便于 关系 的 重组 )。 


在 存储 和 分 析 大 量 的 数据 时 分 割 非常 有 用 。 例 如 ， 出 于 数据 分 析 的 目的 ，DreamHome 
的 关系 ArchivedPropertyForRent 中 存储 了 数 十 万 个 元 组 。 在 一 个 分 公司 中 搜索 一 个 特定 的 
元 组 会 非常 耗 时 ,但 我 们 可 以 通过 对 该 关系 进行 水 平分 割 ， 即 一 个 分 公司 属于 一 个 分 割 的 方 
法 ， 缩 短 搜索 时 间 。 我 们 可 以 使 用 图 19-10 所 示 的 SQL 语句 在 Oracle 中 为 上 面 的 情形 创建 
( 散 列 ) 分 割 。 

除了 散 列 分 割 以 外 ， 其 他 和 常见 的 分 割 有 范围 分 割 (根据 一 个 或 多 个 属性 的 取 值 范围 来 定 
义 分 割 ) 和 列表 分 割 (根据 某 个 属性 值 的 列表 定义 分 割 )。 还 有 组 合 类 型 的 分 割 ， 如 范围 - 
散 列 分 割 和 列表 - 散 列 分 割 (根据 属性 的 取 值 范围 或 值 的 列表 定义 分 割 ， 然 后 再 基于 某 个 散 
列 函 数 对 这 些 分 割 进行 再 次 分 割 )。 
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CREATE TABLE ArchivedPropertyForRentPartition( 
propertyNo VARHAR2(5) NOT NULL, 
street VARCHAR2(25) NOT NULL, 
city VARCHAR2(15) NOT NULL, 
postcode VARCHAR2(8), 
type CHAR NOT NULL, 
rooms SMALLINT NOT NULL, 
rent NUMBER(6, 2) NOT NULL, 
ownerNo VARCHAR2(5) NOT NULL, 
staffNo VARCHAR2(5), 
branchNo CHAR(4) NOT NULL, 
PRIMARY KEY (propertyNo), 
FOREIGN KEY (ownerNo) REFERENCES PrivateOwner(ownerNo), 
FOREIGN KEY (staffNo) REFERENCES Staff(staffNo), 
FOREIGN KEY (branchNo) REFERENCES Branch(branchNo)) 
PARTITION BY HASH (branchNo) 
(PARTITION b1 TABLESPACE TB01, 
PARTITION b2 TABLESPACE TB02， 
PARTITION b3 TABLESPACE TB03， 
PARTITION b4 TABLESPACE TB04); 





图 19-10 ”进行 散 列 分 割 的 Oracle SQL 语句 


有 些 情 况 下 ， 我 们 也 可 能 需要 频繁 访问 某 个 超大 关系 的 茶 些 属性 ， 这 时 候 就 可 以 对 关系 
进行 垂直 分 割 ， 将 经 党 被 访问 的 属性 放 到 一 起 作为 一 个 分 割 ， 剩 下 的 属性 则 作为 丸 外 一 个 分 
割 〈 主 关键 字 被 复制 到 各 个 关系 中 ， 便 于 关系 的 重组 )。 
关系 分 割 有 如 下 优点 : 
© 改善 负载 平衡 。 各 个 分 割 可 以 被 分 配 到 二 级 存储 器 的 不 同 区 域 ， 从 而 允许 数据 的 并 
行 访问 。 假 设 关 系 没 有 被 分 割 ， 则 数据 都 存储 在 同一 片区 域 ， 此 时 并 行 访问 这 片区 
域 的 数据 的 操作 之 间 存 在 着 竞争 ， 关 系 的 分 割 可 将 这 种 竞争 最 小 化 。 

© 提高 性 能 。 通 过 限制 要 访问 和 处 理 的 数据 量 以 及 通过 并 行 处 理 来 提高 系统 性 能 。 

e 提高 可 用 性 。 由 于 不 同 的 分 割 存储 在 不 同 的 区 域 ， 因 此 当 一 个 存储 区 域 不 可 用 时 ， 


其 他 分 割 仍然 可 用 。 

© 提高 可 恢复 性 。 小 的 分 割 可 以 更 高 效 地 恢复 (同样 ，DBA 会 发 现 备 份 小 的 分 割 比 备 
份 超大 的 关系 更 容易 些 )。 

e 安全 。 对 于 分 割 中 的 数据 ， 可 以 只 允许 需要 访问 它们 的 用 户 访问 ， 不 同 的 分 割 可 以 
有 不 同 的 访问 限制 。 

关系 分 割 也 有 下 列 缺 点 : 

© 复杂 。 分 割 对 于 终端 用 户 和 查询 并 不 总 是 透明 的 ， 执 行 写 操作 时 ， 使 用 多 于 一 个 分 
割 会 更 加 复杂 。 


© 降低 性 能 。 查 询 时 ， 合 并 多 个 分 割 中 的 数据 要 比 从 没 被 分 割 的 关系 中 获取 数据 慢 。 
e 复制 的 影响 。 垂 直 分 割 要 复制 主 关 键 字 ， 这 不 仅 会 增加 存储 空间 的 大 小 ， 而 且 会 增 
加 淤 在 的 不 一 致 性 。 
考虑 逆 规 范 化 的 影响 
考虑 进行 逆 规 范 化 处 理 对 设计 方法 学 前 面 的 步骤 的 影响 。 例 如 : 可 能 需要 重新 考虑 被 逆 
规范 化 的 关系 上 索引 的 选择 ， 考 虑 是 否 去 掉 某 些 现存 的 索引 ， 以 及 是 否 需要 增加 新 的 索引 。 
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HINE m A E ERE SEE. wR AEA : 
e RZ. AY WA EAA fi Aca A ot E St h AAS l RE o 
e 事务 。 在 每 个 应 用 中 建立 事务 ,将 被 逆 规 范 化 的 数据 的 更 新 作为 一 个 单一 (原子 ) 操 
作 处 理 。 
© 完整 性 批 处 理 。 在 适当 的 时 候 运 行 批 处 理 程序 维护 逆 规 范 化 数据 的 一 致 性 。 
对 于 数据 完整 性 的 维护 ， 和 触发 器 提供 了 最 好 的 解决 方案 ， 虽 然 可 能 会 带 来 一 些 性 能 上 的 
问题 。 表 19-1 对 逆 规 范 化 的 优 缺 点 进行 了 总 结 。 


表 19-1 逆 规 范 化 的 优 缺 点 
优 点 缺 ”点 


通过 下 面 的 方法 提高 性 能 : 。 加 快 数据 读 取 的 速度 ,但 会 降低 更 新 的 速度 

。 预先 计算 导出 数据 。 和 应 用 的 特性 有 关 ， 应 用 改变 时 需要 重新 评价 
。 使 连接 操作 最 少 化 。 会 增加 关系 的 大 小 

© 减少 关系 中 外 部 关键 字 的 数量 。 有 些 情 况 下 能 简化 实现 ， 但 其 他 情况 下 可 能 会 更 复杂 
。 减少 索引 的 数量 (同时 节省 存储 空间 ) 。 牺牲 灵活 性 


。 减少 关系 的 数量 


用 文档 记录 引入 的 可 控 元 余 
对 引入 的 可 挖 元 余 需 用 文档 一 一 记录 下 来 ， 同 时 记录 引入 的 原因 。 特 别 是 当 存 在 多 种 选 
择 时 ， 要 记录 选择 其 中 某 种 方法 的 原因 。 根 据 逆 规 范 化 的 结果 修改 逻辑 数据 模型 。 


19.2 监控 系统 以 提高 性 能 
PRS 监控 系统 和 系统 调 优 
| 目标 | 监控 运行 时 系统 ， 提 高 系统 性 能 ， 目 的 是 修正 不 合理 的 设计 或 者 是 适应 需求 的 变化 。 


我 们 应 该 记得 物理 数据 库 设计 的 主要 目标 之 一 就 是 高 效 地 存储 和 访问 数据 (参见 附录 下 )。 
可 以 基于 下 面 这 些 指 标 对 效率 进行 评估 : 

© 事务 吞吐 率 。 该 指标 表示 在 给 定时 间 段 能 处 理事 务 的 数量 。 在 有 些 系统 中 ， 如 机 票 
预订 系统 ， 高 的 事务 吞吐 率 是 整个 系统 成 功 的 关键 。 
响应 时 间 。 该 指标 表示 单个 事务 完成 的 延迟 时 间 。 从 用 户 的 角度 来 看 ， 我 们 需要 尽 
可 能 地 缩短 响应 时 间 。 但 有 一 些 设计 者 无 法 控制 的 因素 会 影响 响应 时 间 ， 如 系统 加 
载 和 通信 的 次 数 。 可 以 通过 下 面 一 些 方法 缩短 响应 时 间 : 
m 减少 竞争 和 等 竺 时间， 特别 是 磁盘 IO 等 待 时 间 。 
m 减少 需要 访问 资源 的 时 间 总 数 。 
m 使 用 更 快 的 处 理 组 件 。 

© 磁盘 存储 。 该 指标 表示 存储 数据 库 文件 所 需 的 磁盘 空间 总 量 。 设 计 者 可 能 希望 减少 

磁盘 空间 的 占有 量 。 

然而 ,不 存在 某 一 项 指标 总 是 对 的 。 通 常 ， 我 们 需要 在 多 种 因素 之 间 权 衡 以 达到 一 种 合 
理 的 平衡 。 例 如 ， 增 加 存储 数据 量 的 大 小 会 缩短 响应 时 间或 者 提高 事务 的 吞吐 率 。 初 始 物理 
数据 库 设计 不 应 该 视 为 静态 的 ， 而 应 该 看 作 是 对 实际 系统 可 能 如 何 运行 的 评估 。 初 始 的 设计 
一 旦 实现 ,就 有 必要 对 系统 进行 监控 ， 并 根据 观察 到 的 性 能 情况 和 需求 的 变化 ， 对 系统 进行 
必要 的 调 优 (参见 步骤 8 )。 许 多 DBMS 为 数据 库 管 理 员 (DBA) 提供 了 用 于 监控 系统 运行 
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以 及 对 系统 进行 调 优 的 工具 。 

对 数据 库 的 调 优 可 以 带 来 很 多 好 人 处: 

o 调 优 可 以 避免 新 硬件 的 采购 。 

e 调 优 可 以 降低 对 硬件 配置 的 要 求 。 因 此 系统 就 可 以 选用 更 少 的 、 更 便宜 的 硬件 ， 对 
硬件 的 维护 费用 也 会 随 之 减少 。 
一 个 经 过 调 优 的 系统 将 会 有 更 短 的 响应 时 间 和 更 高 的 吞吐 率 ， 从 而 提高 了 用 户 的 使 
用 效率 ， 因 而 也 就 提高 了 企业 的 生产 率 。 

e 缩短 啊 应 时 间 可 以 提高 员工 的 工作 热情 。 

e 缩短 响应 时 间 可 以 增加 客户 的 满意 度 。 

最 后 两 个 好 处 与 其 他 好 处 相 比 ， 更 加 无 形 ， 更 加 无 法 量化 。 当 然 我 们 也 可 以 说 太 慢 的 响 
应 时 间 会 降低 员工 的 工作 热情 ， 并 会 面临 失去 客户 的 潜在 危险 。 要 对 运行 时 系统 进行 调 优 ， 
物理 数据 库 的 设计 者 必须 清楚 不 同 的 硬件 组 件 之 间 如 何 相互 影响 ， 并 且 会 对 数据 库 的 性 能 产 
生 怎 样 的 影响 ， 下 面 我 们 将 就 这 部 分 内 容 进 行 讨论 。 
理解 系统 资源 

内 存 。 对 内 存 的 访问 比 对 二 级 存储 器 的 访问 要 快 得 多 ， 有 时 候 能 快 几 万 甚至 几 十 万 售 。 
一 般 情 况 下 ， 为 DBMS 和 数据 库 系统 提供 的 内 存 越 大 ， 系 统 运行 得 越 快 。 正 确 的 做 法 是 保 
证 至 少 有 5% 的 内 存 富余 ， 同 样 ， 建 议 富余 的 内 存 不 要 超过 10%， 否 则 对 内 存 的 使 用 就 不 是 
最 优 的 。 如 果 内 存 不 足以 容纳 所 有 进程 ， 操 作 系 统 就 会 通过 将 进程 占用 的 页 转 存 到 磁盘 上 的 
方法 来 释放 内 存 。 如 果 接 下 来 要 用 到 转 出 的 某 个 页 面 ， 操 作 系 统 就 必须 从 磁盘 中 读 取 该 页 。 
有 时 候 为 了 释放 内 存 ， 可 能 需要 把 整个 进程 都 从 内 存 交 换 到 磁盘 ， 然 后 再 交换 回来 。 当 页 面 
调度 或 者 页 交换 过 多 时 ， 就 说 明 内 存 部 分 出 现 了 问题 。 

要 想 高 效 地 利用 内 存 ， 就 必须 了 解 目标 DBMS 如 何 使 用 内 存 ， 在 内 存 中 维护 了 哪些 组 
冲 区 ， 以 及 可 以 通过 哪些 参数 来 调整 这 些 缓冲 区 的 大 小 等 。 例 如 ，Oracle 在 内 存 中 维护 了 一 
个 数据 字典 的 缓冲 区 ， 从 理论 上 来 讲 ， 这 块 缓冲 区 要 足够 大 以 保证 90% 对 数据 字典 的 访问 
都 不 再 需要 从 磁盘 上 读 取信 息 。 另 外 还 必须 了 解 用 户 的 访问 模式 : 同时 访问 数据 库 的 用 户 数 
量 的 增加 会 导致 更 多 的 内 存 被 使 用 。 

CPU。CPU 负责 控制 其 他 系统 资源 并 负责 执行 用 户 进 程 ， 是 系统 中 最 昂贵 的 资源 ， 因 
此 需要 正确 使 用 。CPU 的 主要 目标 是 防止 等 待 CPU 的 各 个 进程 之 间 因 争夺 CPU 而 发 生 冲 
突 。 如 果 操 作 系统 或 用 户 进程 发 出 了 太 多 对 CPU 的 操作 请 求 ， 就 会 出 现 CPU HRA, AIT 
是 由 于 页 面 调度 过 多 导致 的 。 

我 们 有 必要 了 解 24 小 时 工作 负载 的 典型 分 布 情况 ， 系 统 资源 不 仅 要 满足 一 般 工 作 负 载 
的 需要 ， 还 要 满足 工作 负载 达到 峰值 时 的 需要 (例如 ， 如 果 在 一 般 情 况 下 CPU 的 使 用 率 已 
是 90%， 空 闲 率 仅 为 10%， 那 么 就 有 可 能 不 能 满足 工作 负载 达到 峰值 时 的 需要 )。 一 种 选 
择 是 在 峰值 时 刻 只 运行 必需 的 工作 ， 其 他 工作 则 在 其 他 时 间 运 行 。 另 一 种 选择 就 是 考虑 多 
CPU 的 配置 ， 这 样 各 个 进程 就 可 以 分 布 到 不 同 的 CPU 上 并 行 运行 。 

CPU MIPS (每 秒 百 万 条 指令 数 ) 可 以 用 作 CPU 平台 之 间 进 行 比较 的 一 个 准则 ， 并 以 此 
来 确定 其 满足 企业 吞吐 率 需 求 的 能 力 。 

磁盘 /0O。 对 于 一 些 大 型 的 DBMS ， 在 存储 和 读 取 数据 时 涉及 大 量 的 磁盘 TO。 磁盘 一 
般 都 有 一 个 推荐 的 IO 速度 ， 如 果 超 过 这 个 速度 ， 就 会 产生 IO 瓶颈 。 近 年 来 ，CPU 的 时 钟 
速度 得 到 了 显著 提高 ,但 是 1/O 速度 却 并 没有 成 比例 地 提高 。 数 据 在 磁盘 中 的 组 织 方 式 对 整 
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个 磁盘 性 能 的 影响 非常 大 。 当 多 个 进程 试图 同时 访问 同一 个 磁盘 时 ， 就 会 发 生 磁盘 冲突 。 大 
多 数 磁盘 对 每 秒 访问 次 数 和 传输 数据 量 都 有 限制 ， 达 到 这 个 极限 时 ， 进 程 就 得 等 待 磁盘 访 
问 。 为 了 避免 出 现 磁 盘 访问 等 待 ， 建 议 将 数据 平均 分 布 到 不 同 的 可 用 磁盘 驱动 器 上 以 减少 性 
能 问题 的 发 生 。 图 19-11 给 出 了 在 磁盘 上 分 布 数据 的 基本 原则 : 

© 操作 系统 文件 和 数据 库 文件 分 开 。 

© 主 数据 库 文 件 和 索引 文件 分 开 。 

e 恢复 日 志文 件 (参见 22.3.3 节 ) 和 整个 数据 库 分 开 。 

如 果 一 个 磁盘 仍然 过 载 ， 可 以 将 其 上 的 一 个 或 者 多 个 经 常 被 访问 的 文件 移 到 另 一 个 不 太 
活跃 的 磁盘 上 ( 即 分布 式 WO)。 对 每 一 个 磁盘 都 使 用 这 条 原则 直到 它们 都 具有 大 臻 相同 的 I/ 
0 量 时 ， 就 达到 了 负载 均衡 。 同 样 ， 物 理 数 据 库 的 设计 者 必须 了 解 DBMS 的 运行 方式 、 硬 
件 的 特性 以 及 用 户 的 访问 模式 。 g 

RAID〈 独 立 磁 盘 元 余 阵 列 ) 技术 的 
引入 带 来 了 磁盘 IO 的 革命 。RAID 是 C E j E 3 m3 
由 一 些 独立 的 磁盘 组 成 的 大 的 磁盘 阵列 ， 操作 系统 。 主 数据 库 文件 索引 文件 恢复 日 志文 件 
通过 有 效 地 组 织 这 些 磁 盘 就 可 以 提高 IO 图 19-11 典型 的 磁盘 配置 
性 能 和 可 靠 性 。 我 们 将 在 20.2.7 节 对 RAID 进行 讨论 。 

网 络 。 当 网 络 上 传输 的 数据 量 太 大 ， 或 者 网 络 冲突 太 大 时 ， 就 产生 了 网 络 瓶 颈 

上 述 的 每 一 种 资源 都 会 影响 其 他 资源 。 一 种 资源 的 改善 一 般 会 导致 男 一 种 资源 的 改善 ， 
例如 : 

e 增加 内 存 会 减少 页 面 调 度 ， 有 助 于 避免 CPU 瓶颈 

e 更 高 效 地 使 用 内 存 会 导致 更 少 的 磁盘 VO. 

小 结 。 调 优 是 一 种 永 无 止境 的 工作 。 在 系统 的 整个 生命 周期 中 ， 都 有 必要 监控 系统 性 
能 ， 特 别 是 要 解决 环境 和 用 户 需 求 的 改变 带 来 的 问题 。 但 是 ， 为 了 提高 性 能 而 对 运行 时 系统 
某 一 部 分 进行 的 改变 ,， 却 可 能 同时 给 其 他 部 分 带 来 负面 影响 。 例 如 ， 为 关系 加 入 一 个 索引 会 
提高 某 个 事务 的 性 能 ， 但 是 却 可 能 会 影响 其 他 事务 的 性 能 ， 也 许 是 更 重要 的 事务 。 如 果 可 
能 ， 要 先 在 测试 数据 库 上 测试 这 些 改动 带 来 的 影响 ， 或 者 在 系统 没有 被 充分 使 用 的 时 候 进 行 
测试 (如 下 班 时 间 )。 

用 文档 记录 调 优 活动 

用 文档 记录 下 系统 调 优 的 机 制 和 原因 ， 特 别 是 存在 多 种 调 优 方法 时 选择 其 一 的 原因 。 
DreamHome 的 新 需求 

除了 对 系统 进行 调 优 使 其 保持 最 佳 性 能 外 ， 还 需要 处 理 需 求 的 变化 。 人 例如， 假设 某 数据 
库 全 面 运行 了 几 个 月 以 后 ， 几 位 DreamHome 系统 的 用 户 提出 了 三 个 新 的 要 求 ; 

(1) 能 够 存储 出 租房 产 的 图 片 ， 以 及 对 该 出 租房 产 主 要 特性 的 描述 。 

在 Microsoft Office Access 中 ， 可 以 使 用 OLE (TRIER AR A) 字段 满足 这 个 需求 ， 
它 可 以 存储 Microsoft Word 或 者 Microsoft Excel 文档、 图片、 声音 以 及 其 他 程序 创建 的 其 
他 类 型 的 二 进 制 数据 。OLE 对 象 可 以 连接 或 者 能 入 Microsoft Office Access 表 的 一 个 字段 中 ， 
然后 就 可 以 显示 在 表单 或 者 报表 中 。 

为 了 实现 这 个 新 需求 ， 我 们 修改 了 表 PropertyForRent 的 结构 ， 包 括 : 

(a) 增加 了 一 个 OLE 类 型 的 名 为 picture 的 字段 ， 用 来 存储 房产 的 图 片 ， 即 扫描 出 租房 
产 的 照片 所 得 到 的 BMP (位 图 ) 图 像 文件 。 
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(b) 增加 了 一 个 Memo 类 型 的 名 为 comments 的 字段 ， 可 以 用 来 存储 长 文本 。 

还 创建 了 一 个 基于 表 PropertyForRent 的 表单 ， 包 含 了 新 的 字段 ， 如 图 19-12 所 示 。 存 
储 图 像 的 主要 问题 是 需要 大 量 的 磁盘 空间 来 存储 图 像 文 件 。 因 此 ， 我 们 还 需要 继续 监控 
DreamHome 数据 库 的 性 能 ， 以 确保 能 满足 这 项 新 的 需求 ， 并 且 不 会 影响 系统 的 性 能 。 


Eg] Properties 


Property No PG21 zi 


Street 18 Dale z 可 一 


City Glasgow . = 
Type Detached | | 
Rooms r 5 


Rent | £600.00) 





SOPE Newly decorated throughout. Well equiped kitchen. | 
jone to local amenities. | 








图 19-12 ”基于 表 PropertyForRent 的 包含 了 图 片 和 描述 字段 的 表单 


(2) 能 够 在 网 络 上 发 布 可 供出 租 的 房产 的 信息 。 

Microsoft Office Access 或 者 Oracle 都 能 满足 这 个 需求 ， 因 为 它们 的 许多 特性 都 能 够 
文 持 网 络 应 用 的 开发 和 在 Internet 上 发 布 信息 。 但 是 ， 使 用 这 些 特性 需要 有 浏览 器 ， 如 
Microsoft Internet Explorer 或 者 Netscape Navigator， 以 及 调制 解 调 需 和 连接 Internet 所 需 的 
其 他 硬件。 我 们 将 在 第 29 章 详细 介绍 数据 库 与 Web 的 集成 技术 。. 
(3) 允许 业主 在 网 上 查看 他 的 房产 的 信息 和 未 来 的 房客 所 作 评 论 。 

这 一 点 需求 在 技术 上 与 前 一 点 没什么 差别 ， 但 要 求 在 数据 库 中 存储 业主 的 登录 信息 ， 包 
括 email 和 密码 。 一 旦 登录 ， 业 主 也 应 该 只 能 看 到 他 自己 房产 的 相关 信息 。( 重 新 组 织 包括 了 
业主 登录 信息 的 Client 关系 参见 图 4-3.) 


本 章 小 结 

© 逆 规 范 化 是 指 对 关系 模式 的 精 化 ， 使 得 修改 以 后 至 少 有 一 个 关系 的 规范 化 程度 低 于 原 关系 的 规范 化 
程度 。 我 们 也 常用 这 个 术语 指 代 将 两 个 关系 合并 为 一 个 新 关系 的 情形 ， 新 生成 的 关系 仍然 是 规范 化 
的 ,但 与 原 关 系 相 比 则 含有 更 多 的 空白 项 。 

o 物理 数据 库 设 计 的 步骤 7 考虑 对 关系 模式 进行 逆 规 范 化 处 理 ， 以 改善 系统 性 能 。 有 些 情况 下 ， 出 于 
性 能 的 考虑 ， 可 能 要 放弃 完全 规范 化 所 带 来 的 一 些 好 处 。 这 仅 在 估计 到 系统 无 法 满足 其 性 能 需求 时 
才 应 该 考虑 。 经 验 表明 ， 如 果 系 统 性 能 不 能 令 人 满意 ， 且 关系 修改 率 很 低 ， 查 询 率 却 很 高 ， 那 么 道 
规范 化 就 是 一 种 可 以 考虑 的 改进 措施 。 
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© 物理 数据 库 设 计 的 最 后 一 步 (步骤 8 ) 是 对 运行 时 系统 的 不 间断 的 监控 和 调 优 ， 以 期 望 获得 最 高 
性 能 。 

e 物理 数据 库 设 计 的 主要 目的 之 一 是 实现 高 效 的 数据 存储 和 数据 访问 。 评 价 效率 的 指标 包括 吞吐 率 、 
响应 时 间 和 磁盘 存储 空间 。 

© 为 了 提高 系统 性 能 ， 必 须 了 解 四 种 基本 硬件 对 系统 性 能 的 影响 以 及 它们 之 间 的 相互 作用 ， 包括 内 
存 、CPU 、 磁 盘 IO 和 网 络 。 


思考 题 


19.1 描述 本 章 给 出 的 物理 数据 库 设 计 方 法 学 各 主要 步骤 的 目标 。 

19.2 在 什么 情况 下 需要 对 逻辑 数据 模型 进行 逆 规 范 化 处 理 ? 举例 说 明 。 
19.3 评价 效率 的 指标 有 哪些 ? 

19.4 讨论 四 种 基本 硬件 对 系统 性 能 的 影响 以 及 它们 之 间 如 何 相 互 作用 。 
19.5 如 何在 磁盘 之 间 分 布 数 据 库 文件 ? 


习题 
19.6 ”研究 你 现在 使 用 的 DBMS 是 否 支持 本 章 步骤 8 中 给 出 的 DreamHome 案例 研究 中 提出 的 三 条 新 
需求 。 如 果 可 以 ， 则 给 出 满足 这 三 条 需求 的 设计 ， 并 在 目标 DBMS 中 实现 。 
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| 第 五 部 分 


Database Systems: A Practical Approach to Design, Implementation, and Management, 6E 


可 选 的 数据 库 专 题 


第 20 章 ， 安 全 与 管理 

第 21 章 ”数据 管理 中 的 职业 、 法 律 与 道德 问题 
第 22 章 ”事务 管理 

第 23 章 ”查询 处 理 





第 20 音 | 


Database Systems: A Practical Approach to Design, Implementation, and Management, 6E 


安全 与 管理 








本 章 我 们 主要 学 习 : 
数据 库 安全 的 范畴 
为 什么 组 织 机 构 都 非常 关注 数据 库 安全 问题 
哪些 类 型 的 威胁 影响 着 数据 库 系统 的 安全 
如 何 基于 计算 机 的 控制 保护 计算 机 系统 
Microsoft Access 和 Oracle 两 个 DBMS 提供 的 安全 措施 
Web 上 的 DBMS 的 安全 策略 
数据 管理 和 数据 库 管理 之 间 的 区 别 
数据 管理 和 数据 库 管 理 的 目的 和 任务 


数据 是 一 种 极 具 价值 的 资源 ， 像 团体 的 其 他 资源 一 样 ， 数 据 也 应 当 受 到 严格 的 控制 和 管 
理 。 对 一 个 组 织 机 构 来 说 ， 部 分 或 者 全 部 数据 可 能 具有 战略 重要 性 ， 因 此 应 该 确保 其 安全 性 
和 机 密 性 。 

在 第 2 章 我 们 已 经 讨论 了 数据 库 的 环境 ， 并且 特别 论述 了 数据 库 管理 系统 (DBMS) 应 
该 提供 的 典型 功能 和 服务 ， 其 中 包括 授权 服务 ， 例 如 DBMS 必须 提供 某 种 机 制 以 保证 只 有 
经 授权 的 用 户 才能 访问 数据 库 。 也 就 是 说 ，DBMS 必须 保证 数据 库 是 安全 的 。 安 全 指 的 是 
保护 数据 库 以 防止 非法 访问 ， 不 管 这 种 访问 是 有 意 的 还 是 无 意 的 。 除 了 DBMS 提供 的 安全 
机 制 以 外 ， 数 据 库 的 安全 还 要 涉及 更 广泛 的 内 容 ， 包 括 保护 数据 库 和 数据 库 环境 的 安全 。 但 
是 ， 这 些 问题 超出 了 本 书 的 范围 ， 有 兴趣 的 读者 可 以 参看 Pfleeger ( 2006 ) 。 
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20.1 节 讨 论 数 据 库 安全 的 范畴 ， 分 析 一 般 而 言 可 能 对 计算 机 系统 安全 构成 威胁 的 因 
Ko 20.2 市 讨论 应 对 这 些 威胁 时 ， 基 于 计算 机 能 采取 的 控制 措施 。20.3 节 和 20.4 节 讲 述 
Microsoft Office Access 2010 和 Oracle llg 两 个 DBMS 提 供 的 安全 措施 。20.5 节 分 析 与 
DBMS 和 Web 相关 的 安全 措施 。20.6 节 总 结 了 在 一 个 组 织 机 构 内 部 数据 管理 和 数据 库 管理 
的 目标 和 和 任务。 本章 所 有 的 例子 都 取 自 11.4 节 和 附录 A 中 的 DreamHome 案例 研究 。 


20.1 数据 库 安全 


本 方 将 讨论 数据 库 安全 的 范畴 ， 并 讨论 组 织 机 构 为 何 一 定 要 高 度 重视 其 计算 机 系统 的 潜 
在 威胁 。 男 外 ， 还 将 研究 这 些 威胁 的 范围 及 其 对 计算 机 系统 造成 的 危害 。 


| 数据 库 安全 | 保护 数据 库 以 抵御 有 意 或 无 意 威 胁 的 机 制 。 
对 于 安全 问题 不 仅仅 要 考虑 数据 库存 储 的 数据 的 安全 ， 安 全 漏洞 还 可 能 会 威胁 系统 的 其 
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他 部 分 ， 从 而 进一步 影响 数据 库 。 因 此 数据 库 安全 涉及 硬件 、 软 件 、 人 和 数据 。 为 了 有 效 地 
实现 安全 保障 ， 必 须 对 系统 加 以 适当 的 控制 ， 这 些 控制 则 是 针对 系统 特定 的 任务 目标 而 制定 
的 。 过 去 常常 被 轻视 甚至 忽视 的 安全 需求 如 今 已 经 逐渐 引起 了 组 织 机 构 的 重视 ， 因 为 越 来 越 
多 的 组 织 机 构 关键 数据 存储 在 计算 机 中 ,而 且 大 们 已 经 认识 到 ， 这 些 数据 的 任何 损坏 、 丢 失 
以 及 低 效 、 不 可 用 都 将 是 一 次 灾难 

数据 库 代 表 了 一 种 关键 的 组 织 机 构 资源 ， 应 该 通过 适当 的 控制 进行 合理 的 保护 。 因 此 ， 
考虑 下 列 与 数据 库 安全 有 关 的 问题 : 

。 盗用 和 假冒 

。 破坏 机 密 性 

。 破坏 隐私 

。 破坏 完整 性 

。 破坏 可 用 性 

这 些 问 题 代表 了 组 织 机 构 在 竭力 降低 风险 时 应 该 考虑 的 方方面面 。 风 险 指 的 是 组 织 机 构 
数据 章 遇 丢失 或 者 破坏 的 可 能 性 。 在 某 些 情况 下 ， 这 些 问题 是 密切 相关 的 ， 即 某 一 行为 造成 
了 某 一 方面 的 损失 ， 同 时 也 可 能 对 其 他 方面 造成 破坏 。 此 外 ， 对 于 某 些 有 意 或 者 无 意 的 行为 
而 引发 的 假冒 或 者 泄露 隐私 的 问题 ， 数 据 库 或 者 计算 机 系统 未 必 能 察觉 得 到 。 

盗用 或 假冒 不 但 会 影响 数据 库 环境 ， 而 且 还 会 影响 到 整个 组 织 机 构 。 因 为 导致 这 类 问题 
出 现 的 原因 是 人 本 身 ， 所 以 应 该 致力 于 对 人 的 控制 ， 以 减少 这 类 问题 发 生 的 几率 。 盗 用 或 假 
冒 的 行为 不 一 定 会 修改 数据 ， 它 与 泄露 隐私 和 机 密 的 行为 造成 的 结果 类 似 。 

机 密 性 是 指 维持 数据 保密 状态 的 必要 性 ， 通 常 只 针对 那些 对 组 织 机 构 至 关 重 要 的 数据 
而 言 ;而 隐私 是 指 保护 个 体 信 息 的 必要 性 。 由 于 安全 漏洞 而 导致 机 密 性 被 破坏 会 给 组 织 机 
构 带 来 损失 ， 例 如 使 组 织 机 构 责 失 竞争 力 ; 而 隐秘 被 泄密 则 可 能 会 使 组 织 机 构 面临 法 律 
问题 。 

数据 完整 性 的 破坏 会 导致 产生 无 效 或 者 被 损毁 的 数据 ， 这 些 数 据 会 严重 影响 组 织 机 构 的 
正常 运作 。 现 在 ， 许 多 组 织 机 构 都 要 求 数据 库 系统 不 间断 运作 ， 即 所 谓 的 “24X7” (一 天 24 
小 时 ， 一 星期 7 天 ) 不 停机 运行 模式 。 可 用 性 被 破坏 则 意味 着 数据 或 者 系统 无 法 访问 ， 或 者 
二 者 同时 都 无 法 访问 ， 这 将 严重 影响 组 织 机 构 的 经 济 效益 。 在 某 些 情况 下 ， 导 致 系统 不 可 用 
的 故障 也 会 导致 数据 损毁 。 

数据 库 安全 是 在 不 过 分 约束 用 户 行为 的 前 提 下 ， 尽 力 以 经 济 高 效 的 方式 将 可 预见 事件 
造成 的 损失 降 至 最 小 。 最 近 ， 基 于 计算 机 的 犯罪 活动 大 幅度 增加 ， 预 计 今后 几 年 还 将 持续 
上 升 。 


威胁 


威胁 | 有 意 或 是 无 意 的 、 可 能 会 对 系统 造成 负面 影响 的 、 进 而 影响 企业 运作 的 任何 情况 或 
事件 。 


威胁 可 能 是 由 会 给 组 织 机 构 带 来 危害 的 某 种 局 势 或 者 事件 产生 的 ， 这 种 局 势 或 者 事件 
涉及 人 、 人 的 操作 以 及 环境 。 危 害 可 能 是 有 形 的 ， 比 如 人 硬件、 软件 或 数据 遭 到 了 破坏 或 者 
ER; 也 可 能 是 无 形 的 ， 比 如 组 织 机 构 因 此 失去 了 信誉 或 者 客户 的 信赖 。 任 何 组 织 机 构 
都 将 面临 的 问题 是 发 现 所 有 可 能 的 威胁 ， 至 少 组 织 机 构 应 当 投 入 时 间 和 精力 找 出 后 果 最 
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为 严重 的 威胁 。 

在 上 一 节 里 ， 我 们 分 析 了 某 些 有 意 或 无 意 的 行为 可 能 造成 的 危害 。 不 管 这 些 威胁 是 有 意 
还 是 无 意 的 ,危害 的 结果 都 是 一 样 的 。 有 意 的 威胁 来 自 人 ， 制 造 威胁 的 人 可 能 是 授权 用 户 ， 
也 可 能 是 未 授权 用 户 ， 其 中 还 可 能 包括 组 织 机 构 外 部 人 员 。 

任何 威胁 都 必须 被 看 作 是 一 种 潜在 的 安全 漏洞 ， 如 果 入 侵 成 功 ， 将 会 对 组 织 机 构造 成 一 
定 的 冲击 。 表 20-1 列举 了 各 种 不 同类 型 的 威胁 ,同时 还 列举 了 它们 可 能 造成 的 破坏 。 例 如 
“查看 和 泄露 未 授权 数据 ”"， 这 种 威胁 可 能 就 会 导致 次 用 和 假冒 ， 还 会 导致 组 织 机 构 机 密 及 隐 
私 的 泄露 。 


表 20-1 威胁 示例 
据 和 普通 数据 混淆 在 一 起 输出 | 
安全 机 制 失效 导致 超出 常规 的 访问 | | VvV fv | Vv 
洪水 、 爆 炸 


威胁 对 组 织 机 构造 成 危害 的 后 果 的 严重 程度 取决 于 很 多 因素 ， 例 如 是 否 存在 相应 的 对 策 
或 应 急 措 施 。 比 如 说 ， 如 果 二 级 存储 设备 发 生硬 件 故 障 而 崩 演 ， 那 么 所 有 的 数据 处 理 活动 都 
将 终止 ， 直 到 该 问题 得 到 解决 。 恢复 也 取决 于 多 种 因素 ， 其 中 包括 最 后 备份 的 时 间 和 恢复 系 
统 所 需 时 间 。 

首先 组 织 机 构 需 要 明确 其 可 能 面临 的 威胁 ， 并 开始 着 手 拟定 相应 的 解决 方案 和 应 对 策 
略 ， 同 时 考虑 实施 成 本 。 显 然 ， 在 那些 只 会 导致 轻微 损失 的 威胁 上 投入 大 量 的 时 间 、 精 力 和 
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资金 得 不 偿 失 。 组 织 机 构 的 业务 种 类 也 会 影响 我 们 对 可 能 遭受 威胁 类 型 的 考虑 ， 对 于 某 些 组 
织 机 构 来 说 ， 某 些 威胁 基本 不 会 出 现 。 但 是 ， 这 些小 概率 事件 也 应 该 在 考虑 之 中 ， 尤 其 是 那 
些 后 果 严 重 的 事件 。 图 20-1 对 计算 机 系统 安全 的 潜在 威胁 进行 了 小 结 。 







硬件 

火灾 、 洪 水 或 爆炸 ， 因 断 电 或 
电 涌 导致 数据 丢失 ， 安 全 机 人 制 失 
效 导 致 超出 常规 的 访问 ， 盗 窃 设 


A a daat 电子 干扰 DBMS 和 应 用 软件 


安全 机 制 失效 导致 超出 常规 
的 访问 ， 程 序 变更 ， 盗 窃 程 序 


E 


通信 网 络 数据 库 
Gi, AMAR, HAF 未 授权 的 数据 修改 和 复制 ， 
干扰 和 辐射 盗窃 数据 ， 因 断 电 或 电 涌 导 致 
数据 丢失 3 
HA 程序 员 / 操 作 员 数据 管理 员 / 数 据 库 管理 员 
使 用 其 他 人 身份 访问 ， 查 看 制造 “陷阱 门 ”， 程 序 变 更 ( 例 安全 策略 或 过 程 不 完备 


和 泄露 未 授权 数据 ， 员 工 训练 如 开发 不 安全 软件 ) ， 员 工 训练 不 
不 足 ， 黑 客 的 非法 侵 和 人 人， 敲诈 、 足 ， 安 全 策略 或 过 程 不 完备 ， 员 工 
MR, WEAR 短缺 或 罢工 


图 20-1 计算 机 系统 的 潜在 威胁 小 结 


20.2 ”对 策 一 一 基于 计算 机 的 控制 


针对 计算 机 系统 受到 的 威胁 ， 可 采取 的 对 策 涵盖 了 物理 控制 和 管理 过 程 。 尽 管 基 于 计算 
机 的 控制 手段 很 多 ， 但 值得 注意 的 一 点 是 ， 通 常情 况 下 DBMS 的 安全 程度 仅 与 操作 系统 的 
安全 程度 相当 ， 因 为 两 者 密切 相关 。— 典 型 的 多 用 户 计 算 机 环境 如 图 20-2 所 示 。 本 节 重 点 关 
注 多 用 户 环境 下 的 基于 计算 机 的 安全 控制 (部 分 控制 可 能 在 PC 环境 下 不 适用 ): 

e 授权 
访问 控制 
视图 
备份 和 恢复 
完整 性 
加 密 
RAID 技术 
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图 20-2 典型 的 多 用 户 计算 机 环境 


20.2.1 授权 
| 授权 | 授予 一 个 主体 权利 或 者 权限 ， 使 其 能 够 实现 对 系统 或 者 系统 对 象 的 合法 访问 。 


授权 控制 可 以 在 软件 中 实现 ， 授 权 控 制 不 但 能 够 控制 某 一 特定 用 户 可 访问 的 系统 或 者 
对 象 ， 还 可 以 控制 允许 用 户 进 行 的 操作 。 授 权 过 程 包括 对 主体 请 求 访 问 对 象 的 认证 ， 这 里 的 
“主体 ”代表 用 户 或 者 程序 ,“ 对 象 ”代表 数据 库 的 表 、 视 图 、 过 程 、 触 发 器 或 者 在 系统 里 能 
够 创建 的 所 有 其 他 对 象 。 


| 认证 | 一 种 用 来 判断 用 户 身 份 是 否 属实 的 机 制 。 


通常 ， 系 统管 理 员 负责 为 每 一 个 用 户 创建 一 个 账号 ， 以 此 管理 用 户 对 计算 机 系统 的 访 
问 。 每 一 个 用 户 被 赋 以 一 个 唯一 的 标识 符 ， 操 作 系 统 以 此 判断 用 户 的 身份 。 和 用 户 标 识 符 相 
关 的 是 密码 ， 密 码 是 由 用 户 自 己 选择 由 操作 系统 录入 并 存储 的 ， 密 码 是 必需 的 ， 因 为 操作 系 
统 要 根据 密码 来 确认 (或 者 认证 ) 用 户 身份 是 否 属实 。 

上 述 过 程 允许 授权 用 户 对 计算 机 系统 的 使 用 ,但 并 不 一 定 意味 着 该 用 户 被 授权 访问 
DBMS 或 任何 相关 的 应 用 程序 。 用 户 对 DBMS 的 访问 授权 需要 单独 进行 ， 授 权 过 程 类 似 。 
通常 是 由 数据 库 管理 员 ( Database Administrator, DBA) 负责 对 DBMS 的 访问 授权 ，DBA 
还 负责 使 用 DBMS 创建 用 户 账 号 和 密码。 

一 些 DBMS 专门 维护 了 一 张 其 合法 用 户 名 及 其 密码 的 列表 ， 可 与 操作 系统 的 列表 不 同 。 而 
男 一 些 DBMS 所 维护 的 用 户 列表 ， 需 在 用 户 登 录 时 根据 其 登录 标识 符 参 照 操作 系统 的 对 应 列表 
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进行 确认 ， 以 防止 某 些 用 户 试图 使 用 一 个 名 字 登 录 操 作 系统 ， 而 使 用 另 一 个 名 字 登 录 DBMS. 

云 计算 服务 呈现 了 男 一 种 形式 的 计算 机 软 、 硬 件 资源 ， 它 们 通过 网 络 提交 ， 用 户 借助 
Web 浏览 融 或 移动 应 用 来 访问 (参见 3.5 节 )。 这 种 技术 为 许多 基于 Internet 的 商业 、 消 费 品 
和 服务 提供 了 强 有 力 的 支持 ， 本 身 要 求 复 杂 的 基础 设施 ， 以 提供 数据 、 软 件 和 计算 的 远程 访 
问 。 云 计算 被 越 来 越 多 的 公司 采用 ， 视 其 为 以 低 风 险 、 低 代价 方便 地 提供 和 访问 可 伸缩 软件 
应 用 的 一 种 方式 ， 同 时 也 是 降低 整个 IT 设施 投资 的 一 种 方式 。 

对 于 许多 基于 Web 和 基于 云 的 服务 ,认证 的 过 程 更 自动 化 。 一 般 根据 其 安全 级 别 决定 
人 和 计算 机 是 否 通过 email 或 其 他 Internet 服务 介入 用 户 账号 确认 过 程 ， 以 保证 用 户 身份 的 
真实 性 和 账户 的 有 效 创 建 。 网 上 的 银行 服务 、 金 融 业 、 其 他 网 上 和 零售、 公司 的 应 用 产品 和 服 
务 以 及 电子 政务 服务 等 等 ， 都 会 有 各 种 组 合 形 式 的 账户 确认 。 


20.2.2 “访问 控制 


典型 的 数据 库 系 统 访问 控制 机 制 是 基于 权限 的 授予 与 回收 。 权 限 允 许 用 户 创建 或 者 访 
问 ( 即 读 、 写 或 者 修改 ) 某 些 数据 库 对 象 (比如 关系 、 视 图 或 者 索引 )， 或 者 运行 某 些 DBMS 
的 实用 工具 。 用 户 被 授予 满足 其 工作 所 需 的 各 项 权限 。 鉴 于 过 多 不 必要 的 授权 可 能 会 危及 系 
统 安全 ， 所 以 应 该 按 需 授 权 : 只 有 在 用 户 不 具备 某 权限 就 无 法 完成 工作 时 ， 才 应 对 其 进行 相 
应 的 授权 。 某 一 数据 库 对 象 (比如 关系 或 者 视图 ) 的 创建 者 自动 拥有 该 对 象 上 的 所 有 权限 。 
DBMS 将 跟 中 这些 权限 又 是 如 何 授予 其 他 用 户 的 ， 如 果 必 要 需 对 权限 进行 回收 ， 以 确保 任何 
时 刻 只 有 具备 必要 权限 的 用 户 才能 够 访问 数据 库 对 象 。 
自主 访问 控制 

大 多 数 商 用 DBMS 都 提供 一 种 使 用 SQL 进行 权限 管理 的 机 制 ， 即 自主 访问 控制 Discre- 
tionary Access Control, DAC) 机 制 。SQL 标准 通过 GRANT 和 REVOKE 命令 来 支持 DAC 的 
实施 。GRANT 命令 将 权限 授予 用 户 ，REVOKE 命令 回收 权限 。 我 们 已 经 在 7.6 节 讨 论 了 SQL 
标准 是 如 何 文 持 目 主 访问 控制 的 。 

自主 访问 控制 尽管 有 效 ， 但 也 有 弱点 。 特 别 是 在 自主 访问 控制 机 制 里 ， 一 个 未 授权 用 
户 可 以 利用 授权 用 户 ， 令 其 泄露 机 密 数 据 。 例 如 ， 某 未 授权 用 户 ， 比 如 DreamHome 案例 研 
究 中 的 一 位 助理 ,创建 了 一 个 用 来 获取 新 客户 信息 的 关系 ， 并 在 系统 的 某 位 授权 用 户 ( 比如 
经 理 ) 不 知情 的 情况 下 ,将 对 新 建 关 系 的 访问 权限 授予 他 。 然 后 这 位 助理 再 偷偷 修改 应 用 
程序 ， 使 得 当 这 位 经 理 在 访问 只 有 他 才 有 权 访 问 的 数据 时 ， 执 行 一 些 隐秘 的 指令 ， 将 关系 
Client 中 的 机 密 数 据 复制 到 助理 新 创建 的 那个 关系 中 。 于 是 未 授权 用 户 ( 即 该 助理 ) 就 拥有 
了 一 份 机 密 数 据 的 副本 ， 即 DreamHome 新 客户 的 资料 ， 然 后 助理 将 应 用 程序 再 次 修改 回去 
以 掩盖 其 非法 行为 。 

显然 ， 还 需要 某 些 安全 机 制 来 消除 这 类 漏洞 ， 强 制 访问 控制 (Mandatory Access Control, 
MAC) 机 制 就 能 够 满足 我 们 的 需求 ， 下 面 将 详细 讨论 。 自 主 访问 控制 是 大 多 数 商 用 DBMS 的 
典型 安全 机 制 ， 只 有 少量 商用 DBMS 支持 强制 访问 控制 。 
强制 访问 控制 

强制 访问 控制 (MAC) 是 一 种 系统 级 的 策略 ， 用 户 无 法 对 其 进行 修改 。 在 该 机 制 中 ， 每 
一 个 数据 库 对 象 都 被 赋予 了 一 个 安全 级 别 (security class)， 每 一 位 用 户 也 都 被 赋予 了 对 某 
种 安全 级 别 的 访问 许可 级 别 〈clearance)， 并 且 制 定 了 用 户 读 、 写 数据 库 对 象 的 规则 (rule). 
DBMS 根据 读 、 写 规则 ， 比 照 用 户 的 访问 许可 级 别 和 用 户 要 访问 对 象 的 安全 级 别 来 决定 是 否 
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允许 用 户 的 此 次 谈 、 写 操作 。 这 些 规则 是 为 了 确保 机 密 数 据 永 远 不 会 被 没有 相应 访问 许可 的 
用 户 得 到 。SQL 标准 中 并 没有 包括 对 MAC 的 支持 。 
一 种 常用 的 MAC 模型 是 Bell-LaPadula 模型 ( Bell and LaPadula，1974 )， 该 模型 的 术 
语 包括 对 象 (比如 关系 、 视 图 、 元 组 和 属性 )、 主 体 (比如 用 户 和 程序 )、 安 全 级 别 和 访问 许 
可 级 别 。 每 一 个 数据 库 对 象 都 被 赋予 了 一 个 安全 级 别 ， 每 一 个 主体 也 都 被 赋予 了 一 个 与 某 
一 安全 级 别 相 对 应 的 访问 许可 级 别 。 系 统 的 安全 级 别 是 有 序 的 ， 包 括 一 个 最 高 安全 级 别 和 
一 个 最 低 安 全 级 别 。 为 了 便于 对 该 模型 进行 讨论 ， 我 们 假设 共有 四 个 级 别 : 绝密 级 (top 
secret,TS)、 机 密级 (secret,S)、 秘 密级 (confidential,C) 和 无 密级 (unclassified,U)， 其 中 ， 
TS>S>C>U， 我 们 将 对 象 或 者 主体 A 的 级 别 标 记 为 class (A), Alby A>B 时 就 表示 A 
级 别 数据 的 安全 程度 要 高 于 B 级 别 的 数据 。 
Bell-LaPadula 模型 对 数据 库 对 象 的 所 有 读 、 写 操作 施加 了 两 条 限制 规则 : 
(1) 简单 安全 特性 : 当 且 仅 当 class (S) >=class (0) HW, EAS 可 以 读 对 象 O. in, 
访问 许可 级 别 为 TS 的 用 户 能 够 读 取 安全 级 别 为 C 的 关系 ， 但 是 访问 许可 级 别 为 C 
的 用 户 则 不 能 够 读 取 安全 级 别 为 TS 的 关系 。 
(2)* 特性 当 目 仅 当 class (S) <=class (0), E% S 可 以 写 对 象 0。 例如， 访问 许 
可 级 别 为 S 的 用 户 只 能 写 安全 级 别 为 S 或 者 TS 的 对 象 。 
如 果 系 统 已 经 实施 了 自主 访问 控制 ， 则 这 些 规则 表示 额外 的 访问 限制 。 所 以 用 户 要 想 
读 、 写 数据 库 对 象 ， 除 了 必须 拥有 使 用 SQL 的 GRANT 命令 (参见 7.6 节 ) 授予 的 权限 以 
外 ， 用 户 的 安全 级 别 和 对 象 的 安全 级 别 之 间 也 必须 满足 上 述 规则 。 
多 级 关系 与 多 实例 化 
为 了 在 关系 DBMS 中 应 用 强制 访问 控制 策略 ， 每 一 个 数据 库 对 象 都 要 被 指派 一 个 安全 
级 别 。 对 象 的 粒度 可 以 是 关系 、 元 组 甚至 单个 属性 值 。 假 设 每 一 个 元 组 都 被 赋予 了 一 个 安全 
级 别 ， 这 种 状况 就 体现 了 多 级 关系 (multilevel relation) 这 个 概念 ， 多 级 关系 指 的 是 同一 个 
关系 在 具有 不 同安 全 许可 级 别 的 用 户 眼 里 具有 不 同 的 元 组 。 
例如 ， 另 外 添加 了 一 个 属性 的 关系 Client， 如 图 20-3a 所 示 ， 该 属性 记录 了 每 一 个 元 组 
的 安全 级 别 。 
具有 S MA TS 许可 级 别 的 用 户 将 能 够 看 到 关系 Client 中 所 有 的 元 组 。 但 是 具有 C 许可 
级 别 的 用 户 则 只 能 看 到 前 两 个 元 组 ， 具 有 TU 许可 级 别 的 用 户 则 无 法 访问 任何 元 组 。 假 设 具 
有 C 许可 级 别 的 用 户 希 望 将 元 组 (CR74, David, Sinclaire) 插入 关系 Client 中 ，Client 的 
主 关键 字 是 clientNo。 插 入 操作 将 被 拒绝 ， 因 为 它 破坏 了 主 关键 字 的 约束 (参见 4.2.5 节 )。 
但 是 这 次 不 成 功 的 插入 操作 却 告诉 具有 C 许可 级 别 的 用 户 Client 中 已 经 存在 一 个 主 关 键 字 
为 CR74 的 元 组 ， 且 该 元 组 的 安全 级 别 高 于 C。 这 将 违背 了 系统 的 安全 需求 : 用 户 不 能 得 知 
任何 安全 级 别 高 于 自己 的 许可 级 别 的 对 象 的 信息 。 | 
将 安全 级 别 属性 也 视 为 主 关 键 字 的 一 部 分 就 可 以 解决 这 个 推断 问题 。 再 次 考虑 上 面 的 
例子 ， 此 时 将 允许 用 户 将 这 一 新 的 元 组 插入 关系 Client 中 ， 修 改 后 的 关系 实例 如 图 20-3b 所 
Ro RA C 许可 级 别 的 用 户 可 以 看 到 前 两 个 元 组 以 及 新 增 的 这 个 元 组 ， 然 而 具有 S 或 者 TS 
许可 级 别 的 用 户 则 可 以 访问 全 部 五 个 元 组 。 允 许 执行 上 述 插入 操作 的 结果 就 是 在 一 个 关系 中 
有 两 个 ClientNo 的 值 都 为 CR74 的 元 组 ， 这 容易 让 人 糊涂 。 处 理 这 种 情况 的 办 法 是 假设 具有 
高 级 别 的 元 组 具有 和 较 高 的 优先 级 ， 只 允许 用 户 访问 优先 级 高 的 元 组 ,或 者 只 允许 用 户 访 问 一 
个 元 组 ， 究 竞 访 问 哪 一 个 ， 要 根据 用 户 的 许可 级 别 来 决定 。 这 种 在 具有 不 同 许可 级 别 的 用 户 
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眼 里 数据 对 象 具 有 不 同 值 的 现象 就 是 多 实例 化 (polyinstantiation ) 。 


Kay 0207-774-5632 | Flat 
Stewart 0141-848-1825 | Flat 
Ritchie 01475-392178 | House 





Tregar 01224-196720 | Flat 


a) 增加 了 一 个 表示 每 个 元 组 安全 级 别 的 属性 的 关系 Client 


Er [ane [rene [one [oie 


Kay 0207-774-5632 | Flat 425 
Stewart 0141-848-1825 | Flat 
Ritchie 01475-392178 | House 





‘Tregar 01224-196720 | Flat 
Sinclaire 


b) 关系 Client 中 有 两 个 元 组 的 clientNo 都 为 CR74。Cient 的 主 关键 字 为 (clientNo, securityClass ) 
20-3 


尽管 强制 访问 控制 确实 专注 于 弥补 日 主 访问 控制 的 缺点 ,但 是 MAC 也 有 其 缺点 ，MAC 
的 一 个 主要 缺点 就 是 MAC HEA aA. BUN, MAC 策略 通常 要 由 数据 库 或 者 系统 管理 员 
建立 ， 有 时 候 这 种 分 级 机 制 显 得 不 够 灵活 。 


20.2.3 WE 


视图 | 视图 是 作用 于 基础 关系 的 一 个 或 多 个 关系 运算 的 动态 结果 ， 即 视图 就 是 这 些 关系 运 
算 的 结果 关系 。 视 图 是 一 个 虚 (virtual) 关系 ， 在 数据 库 中 并 不 实际 存在 ， 它 根据 某 个 用 户 
的 请 求 并 在 请 求 那 一 刻 才 计算 产生 。 

通过 视图 机 制 可 问 茶 些 用 户 隐 藏 数 据 库 的 一 部 分 信息 ， 因 而 是 一 种 强大 而 灵活 的 安全 机 
制 。 用 户 不 会 知道 未 在 视图 中 出 现 的 任何 属性 或 行 是 否 存 在 。 视 图 可 以 定义 在 多 个 关系 上 ， 
用 户 被 授予 适当 的 权限 以 后 就 可 以 使 用 视图 ， 具 有 对 视图 使 用 权限 的 用 户 只 能 访问 该 视图 而 
不 能 访问 视图 所 依赖 的 基础 关系 。 这 样 一 来 ， 使 用 视图 就 比 简单 地 将 基础 关系 的 使 用 权限 授 
予 用 户 更 具有 限制 性 ， 从 而 更 加 安全 。 本 书 4.4 节 和 7.4 节 已 经 就 视图 进行 过 详细 讨论 。 


20.2.4 备份 和 恢复 
| 备份 | 周期 性 地 将 数据 库 、 目 志文 件 (可 能 还 有 程序 ) 复制 到 脱 机 的 存储 媒介 上 的 过 程 。 


DBMS 应 该 提供 备份 机 制 来 帮助 遭遇 故障 的 DBMS 进行 恢复 。 定 期 备份 数据 库 副 本 和 
日 志文 件 ， 并 确保 这 些 备份 被 放置 在 安全 的 地 方 。 一 且 发 生 故 障 导致 数据 库 不 可 用 ， 可 以 使 
用 备份 副本 和 日 志文 件 中 记载 的 信息 将 数据 库 恢 复 到 一 个 尽 可 能 新 的 、 一 致 的 状态 。 如 何 使 
用 日 志文 件 恢复 数据 库 的 内 容 详 见 22.3.3 节 。 


日 志 | 保存 并 维护 将 数据 库 全 部 变化 都 记录 在 案 的 日 志文 件 ， 从 而 保证 在 出 现 故障 时 能 够 
有 效 地 进行 恢复 的 过 程 。 


DBMS 应 该 提供 日 志 机 制 ， 来 跟踪 事务 的 当前 状态 和 数据 库 的 变化 ， 对 恢复 过 程 提供 文 
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持 。 日 志 的 优点 在 于 ， 万 一 出 现 故障 ， 可 以 利用 数据 库 的 备份 副本 和 日 志文 件 记 载 的 信息 将 
数据 库 恢复 到 最 近 的 、 一 致 的 状态 。 如 果 故 障 系统 没有 日 志 机 制 ， 那 么 唯一 的 恢复 方法 就 是 
使 用 数据 库 最 近 的 备份 版 本 对 数据 库 进 行 修 复 。 但 是 ， 若 没有 日 志文 件 ， 数 据 库 最 后 一 次 备 
份 之 后 的 所 有 修改 结果 就 会 丢失 。 日 志 的 工作 过 程 详 见 22.3.3 节 。 


20.2.5 “完整 性 


完整 性 约束 也 有 助 于 维护 数据 库 系统 的 安全 ， 完 整 性 约束 可 以 防止 非法 数据 的 生成 ， 从 
而 避免 产生 容易 误解 的 或 不 正确 的 结果 。 完 整 性 约束 的 内 容 已 经 在 4.3 节 进 行 了 讨论 。 


20.2.6 WE 
| 加 密 | 使 用 特定 算法 对 数据 进行 编码 ， 使 得 任何 没有 解密 密 钥 的 程序 都 无 法 读 取 数据 。 


如 果 数 据 库 系统 存储 了 非常 机 密 的 数据 ， 就 有 必要 对 其 进行 编码 处 理 ， 作 为 对 外 部 潜在 
威胁 或 者 非法 访问 企图 的 一 种 防范 。 为 此 ， 某 些 DBMS 提供 了 加 密实 用 工具 。DBMS 可 访 
问 数据 〈 解 码 之 后 )， 但 是 因为 对 数据 进行 解码 要 花费 些 时 间 ， 所 以 性 能 会 降低 。 加 密 还 可 
以 在 数据 通过 通信 线路 进行 传输 的 过 程 中 保护 数据 的 安全 。 对 数据 进行 编码 以 隐藏 信息 的 算 
法 有 很 多 ,一 些 是 不 可 逆 的 ， 男 一 些 则 是 可 递 的 。 不 可 道 的 算法 ， 正 如 其 名 字 上 暗示 的 那样 ， 
不 允许 原始 数据 公开 ,但 可 用 这 些 数据 来 获取 有 效 的 统计 信息 。 可 道 的 方法 较为 通用 。 为 了 
在 不 安全 的 网 络 上 安全 地 传输 数据 需要 用 到 密码 系统 ， 密 码 系统 包括 : 

o 对 数据 (明文) 进行 加 密 的 加 密 密 铀 。 

e 加 密 算法 ,利用 加 密 密 钥 将 明文 转换 为 密 文 。 

e 对 密 文 进 行 解密 的 解密 密 钥 。 

e 解密 算法 ,利用 解密 密 钥 将 密 文 重新 转换 为 明文 。 

对 称 加 密 算法 使 用 的 加 密 、 解 密 密 钥 相同 ， 因 而 密 钥 的 交换 需要 依赖 于 安全 的 通信 线 
路 。 但 是 ， 大 部 分 用 户 可 以 访问 的 通信 线路 都 不 安全 ， 要 想 实现 真正 的 安全 ， 密 钥 需 与 消息 
同样 长 (Leiss，1982 )， 可 是 大 部 分 可 行 的 密码 系统 都 是 基于 用 户 密 钥 比 消息 要 短 这 一 点 设 
计 的 。 名 为 数据 加 密 标 准 (Data Encryption Standard, DES) 的 加 密 方 案 是 一 种 由 IBM 开发 
的 标准 加 密 算 法 。 由 于 这 种 方案 的 加 密 和 解密 都 使 用 同一 个 密 钥 ， 因 此 应 该 保证 密 钥 的 机 
密 性 ， 但 是 却 无 需 保 证 算法 的 机 密 性 。DES 算法 使 用 56 位 的 密 钥 加 密 传 输 每 一 个 64 位 长 
的 明文 块 。DES 的 安全 性 并 不 被 广泛 认可 ， 一 些 人 认为 应 该 使 用 更 长 的 密 铀 。 例 如 ，PGP 
(Pretty Good Privacy) 方案 就 是 采用 128 位 的 对 称 算法 对 数据 进行 加 密 传输 的 。 

目前 ，64 位 的 密 钥 已 可 被 拥有 特殊 便 件 的 大 国 破解 ， 虽 然 代 价 不 菲 。 很 快 ， 这 种 技术 
也 将 会 被 有 组 织 的 犯罪 集团 、 大 型 机 构 和 小 国 和 掌握。 尽管 有 人 宣称 80 位 的 密 钥 今后 也 能 够 
被 破解 ， 但 是 128 位 的 密 钥 在 可 预见 的 一 段 时 间 内 不 会 被 破解 。 我 们 使 用 术语 “ 强 认 证 ” 
( strong authentication) 和 “ 弱 认 证 ”( weak authentication) 对 算法 进行 区 分 : 不 管 出 于 何 种 
目的 ， 利 用 现 有 知识 和 技术 无 法 破解 的 算法 就 是 “ 强 认 证 ”， 和 否则 就 是 “ 弱 认 证 ”。 

另外 一 种 密码 系统 使 用 不 同 的 密 钥 加 密 和 解密 ， 被 称 为 非 对 称 加 密 算法 。 公 开 密 钥 密码 
系统 就 是 非 对 称 加 密 算法 ， 它 使 用 两 个 密 钥 : 一 个 是 公 钥 ， 另 一 个 是 私 钥 。 加 密 算法 可 以 公 
开 ， 所 以 任何 想 要 给 某 位 用 户 发 送 报 文 的 人 ， 都 可 使 用 该 用 户 的 公 钥 以 及 公开 的 加 密 算法 对 
报 文 加 密 传 送 。 只 有 拥有 私 钥 的 用 户 才能 对 报 文 解 密 。 公 钥 密 码 系统 也 可 用 于 发 送 带 有 “ 数 
字 签 名 ”的 报 文 ， 数 字 签 名 可 用 于 验证 发 送 报 文 的 人 和 宣称 发 送 了 该 报 文 的 人 是 否 为 同一 个 
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人 人。 最 著名 的 非 对 称 加密 系 统 就 是 RSA (RSA 来 源 于 三 个 算法 设计 者 名 字 的 首 字母 )。 

通常 ， 对 称 算 法 在 计算 机 上 的 执行 速度 比 非 对 称 算 法 要 快 得 多 。 但 实际 上 ， 两 者 经 常 被 
结合 起 来 使 用 : 用 公开 密 钥 算法 加 密 随 机 产生 的 加 密 密 钥 ， 用 对 称 算法 和 该 随机 密 钥 对 真正 
要 发 送 的 报 文 进行 加 密 。 我 们 将 在 20.5 节 讨 论 Web 环境 下 的 加 密 。 


20.2.7 RAID (独立 磁盘 元 余 阵 列 ) 


运行 DBMS 的 硬件 必须 具备 容错 的 性 能 ， 即 使 在 硬件 组 件 出 现 故 障 的 情况 下 ，DBMS 
还 能 够 继续 运行 。 这 就 表明 系统 必须 具备 见 余 组 件 ， 无论 何 时 一 个 或 多 个 组 件 出 现 故 障 时 ， 
元 余 组 件 都 能 够 无 缝 地 集成 到 正在 运行 的 系统 当中 。 应 该 具备 容错 特性 的 主要 便 件 组 件 包括 
磁盘 驱动 器 、 磁 盘 控 制 器 、CPU、 电 源 和 风扇 。 磁 盘 驱 动 器 是 最 脆弱 的 组 件 ， 发 生 故 障 的 频 

解决 方法 之 一 就 是 采取 独立 磁盘 宛 余 阵列 (Redundant Array of Independent Disks, RAID) 
技术 。RAID 原本 代表 廉价 磁盘 宛 余 阵列 (Redundant Array of Inexpensive Disk)， 但 是 最 近 ， 
RAID 中 的 “I” 代 表 的 是 独立 (Independent), RAID 是 由 多 个 独立 的 磁盘 构成 的 大 型 磁盘 阵 
列 ， 它 能 够 提高 可 靠 性 ， 同 时 也 能 够 提高 性 能 。 

系统 性 能 的 提高 是 通过 数据 条 带 化 ( data stripe) 技术 实现 的 : 数据 被 分 成 大 小 相同 的 部 
分 (条 带 单元 )， 透 明 地 分 布 到 多 个 磁盘 中 。 表 面 上 看 起 来 是 一 个 大 型 的 、 高 速 的 磁盘 ， 实 
际 上 数据 分 布 在 几 个 小 型 的 磁盘 上 。 条 带 技术 允许 并 行 执 行 多 个 VO 操作 ， 从 而 提高 了 全 局 
的 VO 性能。 与 此 同时 ， 数据 条 市 化 也 能 够 平衡 各 磁盘 的 负载 。 

可 靠 性 的 提高 是 通过 在 多 个 磁盘 上 存储 元 余 信息 并 使 用 奇偶 校 验 编码 或 纠 错 编码 (例如 
Reed-Solomon 编码 ， 参 见 Pless, 1989) 实现 的 。 在 奇偶 校 验 编码 中 ， 每 一 个 字 节 都 设置 一 
个 奇偶 校 验 位 ， 用 来 记录 字 节 中 为 1 的 位 数 是 奇数 还 是 偶数 。 如 果 字 节 中 某 些 位 的 信息 被 破 
坏 ， 则 新 生成 的 奇偶 校 验 位 与 原来 存储 的 奇偶 校 验 信息 不 匹配 。 同 样 ， 如 果 是 原来 存储 的 奇 
偶 校 验 位 被 破坏 ， 它 也 不 会 和 该 字 节 中 的 信息 匹配 。 纠 错 编 码 则 存储 两 个 或 两 个 以 上 的 附加 
位 信息 ， 如 果 一 位 被 破坏 ， 还 能 重 构 原 始 数据 。 不 管 是 奇偶 校 验 编码 还 是 纠 错 编 码 ， 在 将 字 
节 条 带 化 分 布 到 各 个 磁盘 时 均 可 使 用 。 

RAID 有 很 多 不 同 的 磁盘 配置 方法 ， 称 为 RAID 级 别 。 关 于 每 一 个 RAID 级 别 的 简要 描 
述 如 下 所 示 ， 每 一 级 的 详细 图 解 如 图 20-4 所 示 ， 图 上 的 数字 代表 数据 块 的 编号 ， 字 母 表示 
数据 块 的 段 的 编号 : 

è RAID 0 一 一 无 元 余 。RAID 0 不 维护 元 余数 据 ， 因 此 执行 写 操 作 的 性 能 最 好 ， 因 为 无 

需 对 更 新 信息 进行 复制 。 数 据 条 带 化 在 块 这 一 级 进行 。RAID 0 如 图 20-4a 所 示 。 

e RAID 1 一 一 镜像 。RAID 1 在 不 同 磁盘 上 维护 数据 的 两 个 相同 副本 (镜像 )。 为 了 在 
磁盘 故障 的 情况 下 维护 系统 的 一 致 性 ， 写 操作 不 可 以 同时 执行 。 这 是 最 昂贵 的 存储 
解决 方案 。RAID 1 如 图 20-4b 所 示 。 

© RAID 0 十 1 一 一 无 元 余 镜像 。 这 一 级 综合 应 用 了 条 带 和 镜像 技术 。 

© RAID 2 一 一 主 存 方式 的 纠 错 编码 。 这 一 级 的 条 带 化 单元 是 位 ， 宛 余 方案 采用 海 明 编 
fH. RAID 2 如 图 20-4c 所 示 。 

© RAID 3 一 一 位 交叉 奇偶 校 验 。 这 一 级 通过 在 阵列 中 的 一 个 磁盘 上 存储 奇偶 校 验 信 
息 来 提供 元 余 信 息 。 在 其 他 磁盘 出 现 故障 时 ， 可 以 利用 这 些 奇 偶 校 验 信息 进行 数据 
恢复 。RAID 3 使 用 的 存储 空间 比 RAID 1 要 小 ,但 奇偶 校 验 磁盘 可 能 会 成 为 瓶颈 。 





RAID 3 如 图 20-4d Aras. 
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b) RAID1 一 一 镜像 


读 涉及 所 有 数据 驱动 器 





c) RAID2 一 一 主 存 方 式 的 纠 错 编 码 (MSECC ) 


e) RAID4 一 一 块 交叉 奇偶 校 验 ( 块 -IP ) f) RAID5 一 一 块 交叉 分 布 式 奇偶 校 验 ( 块 -IP ) 
图 20-4 RAID 级 别 ， 其 中 数字 代表 块 的 编号 ， 字 母 代 表 数 据 块 内 节 的 编号 。 
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© RAID 4 一 一 块 交 又 奇偶 校 验 。 在 这 一 级 中 ， 条 带 化 单元 是 磁盘 块 ， 使 用 一 个 单独 的 
磁盘 来 维护 其 他 磁盘 块 的 奇偶 校 验 块 。 如 果 某 一 磁盘 出 现 故 障 ， 则 可 通过 奇偶 校 验 
块 以 及 其 他 磁盘 的 对 应 块 来 重 构 故 障 磁 盘 的 块 。RAID 4 如 图 20-4e 所 示 。 

© RAID 5 一 一 块 交叉 分 布 式 奇偶 校 验 。RAID 5 使 用 和 RAID 3 相似 的 奇偶 校 验 数据 作 
为 元 余 信 息 ， 但 是 RAID 5 将 奇偶 校 验 数据 分 布 到 所 有 磁盘 上 ， 这 与 条 带 化 源 数据 的 
方式 相同 。 这 种 方式 减轻 了 奇偶 校 验 磁盘 的 瓶颈 效应 。RAID 5 如 图 20-4f 所 示 。 

© RAID 6 一 一 P 十 Q XR. RAID 6 和 RAID 5 相似 ， 对 额外 元 余数 据 的 维护 使 得 RAID 

6 能 够 处 理 多 个 磁盘 故障 的 情况 。RAID 6 采用 纠 错 编码 而 非 奇偶 校 验 码 。 

以 Oracle 为 例 ，Oracle 推荐 使 用 RAID 1 来 重 写 日 志文 件 。 对 数据 库 文件 而 言 ， 如 果 写 
开销 可 以 接受 的 话 ，Oracle 推荐 使 用 RAID 5， 否 则 可 以 使 用 RAID 1 或 者 RAID 0 十 1。 对 
RAID 的 完整 讨论 超出 了 本 书 范围 ， 感 兴趣 的 读者 可 以 参看 下 列 论文 : Chen and Patterson 
(1990) 和 Chen et al. ( 1994 )。 





20.3 Microsoft Office Access DBMS 的 安全 机 制 


本 节 主 要 关注 Microsoft Office Access 2010 提供 的 安全 机 制 。7.6 节 曾 讲述 了 SQL 的 
GRANT 和 REVOKE 语句 。 但 Microsoft Office Access 2010 并 不 支持 这 些 语句 ， 而 是 提供 
了 下 列 数据 库 安全 机 人 制 : 

© 拆 分 数据 库 。 

o 为 数据 库 设 置 密码 。 

e 托管 (启用 ) 数据 库 中 禁用 的 内 容 。 

e 打包 、 签 名 并 部 署 数据 库 。 

拆 分 数据 库 

在 数据 库 中 保护 数据 最 安全 的 方式 就 是 把 数据 库 表 与 数据 库 应 用 对 象 (如 表单 、 报 表 等 ) 
分 离开 来 ， 此 动作 称 为 拆 分 数据 库 。Office Access 2010 提供 了 一 个 数据 库 拆 分 向 导 ， 选 择 
工具 栏 “Move Data ”部 分 的 “ ‘ Access Database ”按钮 即 可 。 按 该 按钮 即 显示 图 20-5 所 示 
数据 库 拆 分 窗口 。 


pies erect 
goed or aes q Hg he ane Sac 
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图 20-5 数据库 拆 分 向 导 窗 口 
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指明 后 端 数据 库 的 位 置 ， 一 旦 复制 到 新 位 置 后 即 可 像 下 一 节 描 述 的 那样 ， 通 过 设置 密码 
做 进一步 保护 。 
为 数据 库 设 置 密码 

设置 数据 库 启动 密码 是 一 种 简单 的 安全 机 制 。 通 过 选择 菜单 File / Info 部 分 的 “密码 
加 密 ” 即 可 设置 密码 。 一 旦 设置 了 密码 ， 以 后 每 次 打开 数据 库 时 就 会 弹出 请 求 输入 密码 的 
对 话 框 。 只 有 那些 输入 了 正确 密码 的 用 户 才 允许 打开 数据 库 。 这 种 方法 是 安全 的 ， 因 为 
Microsoft Office Access 对 密码 进行 了 加 密 处 理 ， 所 以 即使 直接 读 取 数据 库 文件 也 无 法 得 知 
密码。 然而 ,一 旦 数据 库 打 开 后 ， 用 户 就 可 以 访问 数据 库 的 所 有 对 象 。 图 20-6a 为 设置 密码 
的 对 话 框 ， 图 20-6b 则 是 启动 数据 库 时 请 求 输入 密码 的 对 话 框 。 


Set Database Password 


Password: 
| 水杯 冰冰 冰冰 冰冰 站 


Verify: 





在 对 话 框 中 设置 密码 以 控制 每 当 需 要 密码 打开 数据 
对 数据 库 的 访问 〈 密码 在 屏幕 库 时 ， 系 统 显 示 此 对 话 杠 
上 不 显示 ) 
a) 设置 数据 库 密码 的 对 话 杠 b) 启动 数据 库 时 请 求 输入 密码 的 对 话 杠 


K 20-6 利用 密码 保证 DreamHome 数据 库 的 安全 


Microsoft Access 2010 与 以 前 的 版 本 相 比 ， 在 密码 加 密 、 为 高 效 管理 而 与 Microsoft 
SharePoint 的 集成 以 及 检测 应 用 的 信息 使 用 等 方面 都 有 所 改进 。 
托管 (启用) 数据 库 中 禁用 的 内 容 


托管 中 心 是 个 对 话 框 ， 能 用 于 托管 (启用 ) 数据 库 中 禁用 的 内 容 。 托 管 中 心 对 话 框 如 
图 20-7 所 示 。 





Trust Center 









Trusted Publishers 






| 


| 


Trusted tocations Ee E 
| Showing the Message Bar 
© Show the Message Bar in all applications when content has been blocked 


© Never show information about blocked content 


| Add-ins 








Macro Settings 


| DD Enable Trust Center logging 
图 20-7 Microsoft Office Access 托管 中 心 


托管 中 心 能 为 Office Access 2010 数据 库 创建 和 修改 托管 位 置 、 设 置 安全 选项 。 这 些 设 
置 会 影响 一 个 新 建 或 已 存在 数据 库 在 Access 实例 中 打开 时 的 行为 。 托 管 中 心 中 还 包含 一 些 
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规则 : 确定 如 何 评估 数据 库 的 各 组 成 部 分 ; 打开 一 个 数据 库 是 否 安全 ; 托管 中 心 是 否 应 该 禁 
FA (disable) 数据 库 ， 而 让 用 户 决 定 启 用 (enable); 等 等 。 
打包 、 签 名 并 部 署 数 据 库 

打包 并 签名 机 制 首先 把 数据 库 放 在 一 个 Access 部 署 文件 (.accdc) 中 ， 然 后 签署 这 个 
包 ， 并 把 签名 后 的 包 存 放 在 期 望 的 位 置 。 以 后 ， 用 户 能 从 该 包 抽取 数据 库 并 直接 在 数据 库 上 
工作 (但 不 是 在 包 文件 上 )。 打 包 数 据 库 并 对 包 签 名 是 表达 可 信 的 一 种 方式 。 用 户 得 到 一 个 
包 后 ， 若 签名 表明 其 未 被 算 改 ， 同 时 用 户 又 信任 签名 者 的 话 ， 内 容 即 可 放心 使 用 。 

附录 HH 给 出 了 Microsoft Office Access 2010 DBMS 的 概述 (也 可 参见 Web 网 站 )。 


20.4 Oracle DBMS 的 安全 机 制 


附录 HH 对 DBMS Oraclellg 进行 了 概述 。 本 节 将 重点 关注 Oracle 的 安全 机 制 。 我 们 将 
分 析 Oracle 提供 的 两 种 安全 机 制 : 系统 安全 和 数据 安全 。Oracle 所 用 系统 安全 机 制 与 Office 
Access 一 样 ， 就 是 采用 标准 的 用 户 名 和 密码 的 形式 ， 即 用 户 在 访问 数据 库 之 前 必须 提供 合 
法 的 用 户 名 和 密码 ， 当 然 ， 认 证 用 户 的 责任 也 可 交 由 操作 系统 负责 。 图 20-8 是 创建 新 用 
户 Beech 和 设置 认证 密码 的 过 程 。 当 用 户 Beech 试图 连接 数据 库 时 ， 系 统 都 会 弹出 一 个 和 
图 20-9 类 似 的 Connect (连接 ) BK Log On (登录 ) 对 话 框 ， 提 示 用 户 输入 能 够 访问 某 数 据 库 
的 用 户 名 和 密码 。 





图 20-8 创建 新 用 户 Beech 并 设置 认证 密码 


权限 
正如 20.2.2 节 所 述 ， 权 限 就 是 执行 特定 类 型 的 SQL 语句 或 者 访问 其 他 用 户 对 象 的 权力 。 
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Oracle 权限 的 例子 有 : 

© 连接 数据 库 (创建 会 话 ) 

e 创建 表 

e 从 其 他 用 户 的 表 中 选择 行 

Oracle 提供 了 两 种 不 同形 式 的 权限 : \ 

。 系统 权限 | 5 ES 

。 对 象 权限 eae " 

系统 权限 。 系 统 权限 就 是 执行 某 种 特殊 的 操作 
或 者 对 任何 特殊 类 型 的 模式 对 象 执行 某 种 操作 的 权 二 
力 。 例 如 ， 在 数据 库 中 创建 表 空间 和 创建 用 户 这 两 ”图 20-9“ 请 求 答 入 用 户 名 、 密 
种 权限 都 属于 系统 权限 。Oracle 中 有 超过 80 种 不 搂 数 据 库 名 的 登录 对 语 杠 
同 的 系统 权限 。 可 以 使 用 下 列 两 种 方式 之 一 将 系统 权限 授予 用 户 和 角色 ， 或 者 从 用 户 和 角色 
处 回收 系统 权限 : 

e Oracle 安全 管理 需 的 Grant System Privileges/Roles (授予 系统 权限 / 角色 ) 对 话 框 和 

Revoke System Privileges/Roles (回收 系统 权限 /角色 ) 对 话 框 。 

© SQL GRANT 和 REVOKE 语句 (参见 7.6 节 )。 

然而 ， 只 有 那些 被 授予 某 种 系统 权限 时 带 有 ADMIN OPTION 选项 ， 或 是 是 具有 GRANT 
ANY PRIVILEGE 系统 权限 的 用 户 才能 够 授予 或 回收 系统 权限 。 

对 象 权 限 。 对 象 权限 就 是 能 够 在 某 个 表 、 视 图 、 序 列 、 过 程 、 函 数 或 包 上 执行 特殊 操作 
的 权限 或 者 权力 。 不 同 的 对 象 权 限 适 用 于 不 同类 型 的 对 象 。 例 如 ， 删 除 表 Staff 的 元 组 的 权 
限 就 是 一 种 对 象 权 限 。 

一 些 模式 对 象 (例如 簇 集 、 索 引 和 触发 器 ) 没有 相关 的 对 象 权限 ， 对 这 些 对 象 的 使 用 是 
通过 系统 权限 来 控制 的 。 例 如 ， 要 修改 某 复 集 ， 用 户 必须 是 该 篮 集 的 拥有 者 或 具有 ALTER 
ANY CLUSTER 的 系统 权限 。 

用 户 自 动 获得 自己 拥有 模式 下 的 模式 对 象 的 所 有 对 象 权 限 。 用 户 可 以 将 其 拥有 的 模式 
对 象 的 任何 对 象 权限 授予 其 他 用 户 或 角色 。 如 果 授 权 语 句 (GRANT 语句 ) 中 包括 WITH 
GRANT OPTION 选项 ， 被 授权 者 就 能 够 将 该 对 象 权限 继续 授予 其 他 用 户 ; 否则 ， 被 授权 者 
只 能 使 用 该 权限 而 不 能 将 其 授予 其 他 用 户 。 表 和 视图 的 对 象 权限 如 表 20-2 所 示 。 


表 20-2 对 象 权限 允许 被 授权 者 在 表 和 视图 上 执行 的 操作 





"ann | .| mom 
ALTER FA ALTER TABLE 语句 修改 表 的 定义 N/A 
用 DELETE 语句 将 行 从 表 中 删除 。 注 意 : 要 将 对 表 的 mm 
NEEN DELETE 权限 和 SELECT 权限 一 起 授予 用 户 或 者 角色 amet gh oc 
INDEX 用 CREATE INDEX 语句 在 表 上 创建 索引 N/A 
INSERT 用 INSERT 语句 向 表 中 插入 新 行 用 INSERT 语句 向 视图 插入 新 行 
REFERENCES 创建 表 的 引用 约束 。 不 能 将 此 权限 授予 角色 N/A i 
SELECT 用 SELECT 语句 对 表 进 行 查询 用 SELECT 语句 对 视图 进行 查询 
用 UPDATE 语句 对 表 中 的 数据 进行 更 新 。 注 意 : 要 
UPDATE 将 对 表 的 UPDATE 权限 与 SELECT 权限 一 起 授予 用 户 eee 语句 对 视图 中 的 数据 


或 者 角色 
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角色 。 用 户 可 通过 两 种 方式 接收 权限 : 

(1) 显 式 地 授予 用 户 权 限 。 例 如 ， 某 用 户 可 以 将 向 表 PropertyForRent 插 入 行 的 权限 显 
式 地 授予 用 户 Beech: 
GRANT INSERT ON PropertyForRent TO Beech; 


(2) 先 将 权限 授予 角色 ( 某 指定 的 权限 组 )， 然 后 将 角色 授予 一 个 或 多 个 用 户 。 例 如 ， 
用 户 可 以 将 对 表 PropertyForRent 进行 查询 、 插 入 和 更 新 的 权限 授予 角色 Assistant, 
然后 将 角色 Assistant 授予 用 户 Beech。 用 户 可 以 被 授予 多 个 角色 ， 同 一 个 角色 也 
可 以 被 授予 多 个 用 户 。 图 20-10 显示 使 用 Oracle 安全 管理 器 将 这 些 权 限 授予 角色 


Assistant. 


对 此 类 对 象 
可 拥 用 的 权限 


表 名 





所 选 权 限 











图 20-10 ”将 表 PropertyForRent 的 查询 、 插 入 和 更 新 权限 授予 角色 Assistant 


因为 角色 机 制 使 得 对 权限 的 管理 变 得 更 加 简单 ， 能 够 更 好 地 对 权限 进行 管理 ， 所 以 通常 
都 是 将 权限 授予 角色 而 不 是 授予 具体 的 用 户 。 


20.5 DBMS 与 Web 安全 


我 们 将 在 第 29 章 全 面 论述 Web 上 的 DBMS。 本 节 主 要 讨论 如 何 保证 Web 上 的 DBMS 的 
安全 。 建 议 对 Web 上 的 DBMS 的 相关 术语 和 技术 不 熟悉 的 读者 在 阅读 本 节 前 先 阅 读 第 29 章 。 

Internet 传输 依赖 于 底层 的 TCP/IP 协议 ,但 是 无 论 是 TCP/IP 还 是 HTTP， 在 设计 之 初 
都 没有 考虑 安全 问题 。 如 果 没 有 专门 的 软件 ，Internet 上 的 所 有 数据 都 是 用 明文 传输 的 ， 任 
何 对 网 络 进行 监测 的 人 都 能 读 取 。 因 为 Internet 一 直 都 是 一 个 开放 的 网 络 ， 所 以 这 种 形式 的 
攻击 相对 来 说 很 容易 实现 ， 只 要 利用 免费 的 “ 包 监 测 ” 软 件 就 可 以 进行 。 例 如 ， 当 用 户 使 
用 信用 卡 在 Internet 上 购物 时 ， 请 你 考虑 一 下 信用 卡 信 息 被 不 道德 团伙 截取 的 后 果 。 通 过 
Internet 传送 和 接收 信息 ， 遇 到 的 关键 问题 是 如 何 保证 : 
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e 除 发 送 者 和 接收 者 外 ， 任 何人 不 能 访问 该 信息 (隐秘 性 )。 

e 信息 在 传输 过 程 中 不 能 被 修改 (完整 性 )。 

o 接收 者 能 够 确定 信息 的 确 是 来 自发 送 者 (真实 性 )。 

e 发 送 者 能 够 保证 接收 者 是 名 副 其 实 的 接收 者 ( 非 伪 装 性 )。 

© 发 送 者 不 能 否认 曾经 发 送 过 该 信息 (不 可 否认 性 )。 

然而 ， 事 务 保 护 机 制 只 能 解决 部 分 问题 。 一 旦 信息 到 达 Web 服务 器 ， 服 务 器 也 必须 提 
供 保护 机 制 。Web 环境 广泛 使 用 的 三 层 体系 结构 ， 进 一 步 增 加 了 数据 库 访 问安 全 的 复 玉 性 。 
如 今 ， 大 部 分 这 种 结构 的 系统 都 能 够 得 到 安全 保护 ， 但 是 通常 需要 其 他 产品 和 机 制 的 支持 。 

Web 环境 安全 中 另外 一 个 需要 强调 的 问题 是 传输 到 客户 端的 信息 中 可 能 含有 可 执行 代 
码 。 例 如 ，HTML 网 页 中 可 能 包含 ActiveX 控件 、JavaScript/VBScript 以 及 一 个 或 多 个 Java 
applet。 可 执行 代码 能 够 执行 下 面 一 些 恶 意 操作 ， 因 此 必须 采取 措施 加 以 防范 : 

© 破坏 数据 或 者 程序 的 执行 状态 。 
格式 化 整个 磁盘 。 
关闭 整个 系统 。 
将 机 密 数 据 (例如 文件 或 密码 ) 收集 和 下 载 到 其 他 站 点 。 
盗用 他 人 身份 ， 假 冒 用 户 或 用 户 的 机 融 攻 击 网 络 上 的 其 他 目标 。 
封锁 资源 使 得 合法 用 户 和 程序 无 法 使 用 。 

e 导致 非 毁 灭 性 的 但 却 是 恶意 的 影响 ， 尤 指 对 输出 设备 的 恶意 操作 。 

此 前 已 经 就 数据 库 系统 的 一 般 性 安全 机 制 进 行 了 讨论 。 然 而 ， 通 过 公开 的 Internet 和 组 
织 机 构 内 联网 访问 数据 库 的 需求 日 益 增 长 ， 有 必要 对 原 有 机 制 重新 分 析 并 进行 扩充 。 本 节 将 
讨论 这 类 环境 下 与 数据 库 安全 有 关 的 一 些 问 题 。 


20.5.1 ”代理 服务 器 


在 Web 环境 下 ,代理 服务 器 是 位 于 Web 浏览 器 和 Web 服务 器 之 间 的 一 台 计 算 机 。 它 截 
获 所 有 对 Web 服务 器 发 出 的 请 求 ， 并 判断 自己 是 否 就 能 够 完成 这 些 请 求 。 如 果 不 能 ， 它 会 
将 请 求 转发 给 Web 服务 器 。 设 置 代理 服 务 器 主要 有 两 个 目的 : 提高 性 能 和 过 滤 请 求 。 
提高 性 能 

由 于 代理 服务 器 上 保存 了 一 段 时 间 之 内 所 有 请 求 的 处 理 结果 ， 所 以 代理 服务 融 的 设置 能 
够 极 大 地 提高 用 户 组 的 性 能 。 例 如 ;假设 用 户 A 和 用 户 B 通过 代理 服务 器 访问 Web。 首 先 ， 
用 户 A 请 求 访 问 某 个 网 页 ， 稍 后 ， 用 户 B 也 请 求 同 一 个 网 页 。 这 时 ， 代 理 服 务 器 并 不 将 B 
的 请 求 转发 给 网 页 所 在 站 点 的 Web 服务 器 ， 而 是 将 先前 为 用 户 A 请 求 且 已 经 从 该 站 点 获取 
并 存储 在 本 地 的 缓存 页 面 转发 给 B。 因 为 代理 服务 器 经 党 和 用 户 处 于 同一 网 络 中 ， 所 以 显然 
这 样 操 作 要 快 得 多 。 实 际 的 代理 服务 器 (如 Compuserve 和 America Online 等 大 型 网 站 ) 所 
采用 的 通常 能 够 支持 数 以 千 计 的 用 户 。 

代理 服务 器 也 可 以 用 来 过 滤 请 求 。 例 如 ， 组 织 机 构 可 以 利用 代理 服务 器 来 禁止 员工 访问 
某 些 网 站 。 


20.5.2 ”防火墙 
标准 的 安全 建议 是 ， 确 保 Web 服务 器 不 要 连接 任何 内 部 网 络 ， 并 且 做 好 定期 备份 ， 以 
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保证 能 从 不 可 避免 的 攻击 中 重新 恢复 。 当 Web 服务 器 不 得 不 连接 内 部 网 络 时 ， 例 如 为 了 访 
问 公 司 数据 库 ， 若 正确 安装 并 维护 防火 墙 ， 则 可 利用 防火 墙 技术 帮助 阻止 未 授权 访问 。 
防火 墙 是 一 种 用 于 防止 对 私有 网 络 或 来 自私 有 网 络 的 未 授权 访问 的 系统 ， 防火墙 可 
以 用 软件 也 可 以 用 硬件 实现 ， 或 者 软件 、 硬 件 相 结合 。 我 们 经 常用 防火 墙 来 阻止 未 授权 的 
Internet 用 户 对 接 入 Internet 的 私有 网 络 ， 尤 其 是 对 组 织 机 构 内 联网 的 访问 。 所 有 进入 或 离 
开 组 织 机构 内 联网 的 报 文 都 要 经 过 防火 墙 ， 防 火 墙 对 每 一 个 报 文 进行 分 析 ， 知 不 满足 安全 准 
则 ， 则 报 文 被 阻塞 。 防火 墙 技 术 包 括 : 
e 包 过 滤 。 查 看 每 一 个 进入 或 离开 网 络 的 数据 包 ， 依据 用 户 定 义 的 规则 决定 是 否 允 许 
其 通过 。 包 过 滤 是 一 种 相对 有 效 的 机 制 ， 包 过 滤 对 用 户 透 明 ， 但 是 配置 起 来 比较 困 
难 。 男 外 ， 包 过 滤 容 易 受 到 IP 欺骗 攻击 ( IP 欺骗 是 一 种 未 授权 访问 计算 机 的 技术 ， 
攻击 者 发 送 伪造 了 IP 地 址 的 报 文 ， 让 对 方 计算 机 误 以 为 该 报 文 来 自 可 信任 端口 )。 
e 应 用 级 网 关 。 适 用 于 某 些 应 用 的 安全 机 制 ， 例 如 FTP A Telnet 服务 右 。 这 是 一 种 非 
党 有效 的 机 制 ,但 是 会 使 性 能 降低 。 
e 电路 级 网 关 。 在 建立 TCP 或 UDP (User Datagram Protocol， 用 户 数 据 报 协议 ) 连接 
时 实施 的 安全 机 制 。 一 旦 建立 连接 ， 则 无 需 对 数据 包 做 进一步 检查 即 可 在 主机 之 间 
流动 。 
© 代理 服务 器 。 和 截获 所 有 进入 或 离开 网 络 的 报 文 。 代 理 服 务 器 有 效 地 隐藏 了 真实 的 网 
络 地 址 。 
实际 上 ， 许 多 防火 墙 都 综合 使 用 了 多 种 技术 。 防 火 墙 被 认为 是 保护 私有 信息 的 第 一 道 防 
线 。 为 了 更 加 安全 ， 数 据 应 该 加 密 ， 这 就 是 我 们 接 下 来 要 讨论 的 主题 ， 在 20.2.6 节 也 早 有 
论述 。 


20.5.3 ” 报 文摘 要 算法 和 数字 签名 


报 文摘 要 算法 ， 也 称 单 向 散 列 函数 ,传送 的 信息 包括 一 个 任意 长 度 的 字符 串 ( 报 文 ) 和 
一 个 固定 长 度 的 字符 串 (摘要 或 者 散 列 值 )。 摘 要 具有 下 列 特征 : 

o 要 发 现 能 够 产生 相同 摘要 的 男 一 段 报 文 是 很 困难 的 。 

。 摘要 不 会 泄露 任何 关于 报 文 的 信息 。 

数字 签名 由 两 部 分 信息 组 成 : 根据 正 被 “签名 ”的 数据 计算 得 到 的 位 串 以 及 希望 签名 的 
个 人 或 组 织 的 私有 密 钥 。 数 字 签 名 可 用 来 验证 数据 是 否 真正 来 目 这 个 人 或 这 个 组 织 。 和 手写 
签名 一 样 ， 数 字 签 名 也 具备 许多 有 用 的 特性 : 

e 使 用 相应 公 钥 即 可 验证 发 送 者 身份 的 真实 性 。 

© 不 可 伪造 (假设 能 够 保证 私 钥 的 秘密 性 )。 

© 数字 签名 是 被 签名 数据 的 函数 ， 它 对 其 他 数据 无 效 。 

© 被 签名 的 数据 不 能 被 修改 ,否则 签名 将 不 再 有 效 。 

一 些 数 字 签 名 算法 对 部 分 计算 数据 使 用 报 文摘 要 算法 ， 男 外 一 些 签名 算法 出 于 效率 的 考 
虑 ， 首 先 计 算 报 文 的 摘要 ， 然 后 对 摘要 进行 数字 签名 ， 而 不 是 对 整个 报 文 签名 。 


20.5.4 FEB 


数字 证 书 是 出 于 安全 目的 而 添加 在 报 文中 的 附件 ， 大 部 分 数字 证 书 是 为 了 验证 报 文 发 送 
者 的 身份 是 否 属实 ， 同 时 为 接收 者 提供 一 种 对 应 答 进行 编码 的 方法 。 
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PARAMAR Ej] CA (Certificate Authority, AIE- Ù) 申请 数字 证 书 。 
CA 负责 问 其 发 放 一 个 加 密 的 个 人 数字 证 书 ， 该 数字 证 书包 含 了 申请 者 的 公 钥 和 其 他 一 些 认 
证 信息 。CA 将 自己 的 公 钥 打印 发 放 ， 或 者 通过 Internet 发 放 。 

密 文 的 接收 者 利用 CA 的 公 钥 对 附加 在 报 文 中 的 数字 证 书 进 行 解码 ， 以 证 实 该 报 文 的 确 
是 CA 发 布 的 ， 解码 后 ， 接 收 者 获取 发 送 者 的 公 钥 和 数字 证 书 其 他 的 认证 信息 。 利 用 这 些 信 
息 ， 接 收 者 可 以 发 送 一 个 加 密 回复 报 文 。 

VeriSign 开发 了 下 面 几 类 数字 证 书 : 

。 第 一 类 面向 个 人 (打算 用 于 E-mail). 

e 第 二 类 面 回 组 织 机 构 ( 针 对 那些 要 求 身 份 证 明 的 )。 

e 第 三 类 面向 服务 器 /软件 签名 (针对 那些 拟 通 过 某 个 发 布 的 CA 进行 独立 的 验证 、 身 

份 检查 和 授权 的 )。 

e 第 四 类 面 回 计算 机 之 间 的 联机 商业 事务 。 

e 第 五 类 面 癌 私有 机 构 或 政府 的 安全 保密 。 

目前 证 书 用 的 最 普遍 的 是 S-HTTP 网 站 。Web 浏览 器 若 确 认 一 个 安全 套 接 层 Web 服务 
髓 为 可 信 的 ， 就 能 保证 用 户 与 Web 网 站 的 交互 没有 偷 听 者 ， 并 且 该 网 站 也 就 是 其 宣称 的 网 
站 。(S-HTTP 和 SSL 稍 后 讨论 。) 

显然 ，CA 在 这 个 过 程 中 担当 的 角色 至 关 重 要 ，CA 扮演 着 双方 的 中 间 人 。 在 大 型 的 分 
布 式 复 杂 网 络 环境 下 ， 比 如 Internet， 客 户 端 和 服务 器 端 之 间 可 能 并 没有 建立 相互 信任 的 
机 制 ， 当 双方 需要 进行 安全 会 话 时 ， 第 三 方 信任 模型 是 非常 必要 的 。 但 是 由 于 各 方 都 信任 
CA, 并且 CA 能 够 通过 对 其 证 书 的 签名 担保 每 一 方 的 真实 身份 和 可 信任 度 ， 这 样 各 方 之 间 
都 能 够 相互 认可 、 相 互信 任 。 使 用 最 广泛 的 数字 证 书 的 标准 是 X.509。 


20.5.5 Kerberos 


Kerberos 是 一 种 安全 的 用 户 名 和 密码 的 服务 器 〈Kerberos 是 古 希腊 神话 里 守卫 地 狱 之 门 
的 长 有 三 个 头 的 看 门 狗 )。Kerberos 的 重要 性 在 于 它 能 够 为 网 络 上 的 所 有 数据 和 资源 提供 一 
个 中 央 安 全 服务 器 。 可 信任 的 Kerberos 服务 器 集成 了 许多 安全 特性 ， 包 括 数据 库 访 问 、 登 
录 、 授 权 控 制 等 。Kerberos 与 认证 服务 器 的 功能 类 似 : 验证 和 确认 用 户 身 份 。 安 全 公司 现在 
正在 对 一 种 将 Kerberos 和 认证 服务 器 混合 使 用 的 方法 进行 测试 ， 以 开发 一 种 全 网 络 范围 的 
安全 系统 。 


20.5.6 ”安全 套 接 字 层 和 安全 HTTP 


许多 大 型 的 Internet 产品 开发 商都 在 使 用 像 网 景 ( Netscape) 开发 的 安全 套 接 字 层 (Secure 
Socket Layer, SSL) 这 样 的 加 密 协议 在 Internet 上 传输 机 密 文 档 。SSL 用 私有 密 钥 对 数据 
加 密 ， 并 采用 SSL 连接 进行 传输 。 网 景 的 Navigator 和 IE 都 支持 SSL， 许 多 站 点 也 使 用 该 
协议 来 获取 机 密 的 用 户 信息 ， 例 如 信用 卡号 码 等 。 该 协议 位 于 应 用 层 协 议 〈 例 如 HTTP) 和 
TCP/IP 传输 层 协 议 之 间 ， AWA SIL, Bk Richie. AN SSL 是 位 于 应 用 
层 协议 之 下 的 协议 ， 所 以 它 可 以 被 其 他 应 用 层 协议 〈 例 如 FTP Al NNTP) 使 用 。 

另外 一 种 在 Web 上 安全 传输 数据 的 协议 是 安全 HTTP ( S-HTTP)， 它 是 标准 HTTP 协议 
的 一 个 改进 版 本 。S-HTTP 是 EIT (Enterprise Integration Technologies) 开发 的 ，EIT 于 1995 
年 被 Verifone 有 限 公 司 收购 。 尽 管 SSL 能 够 在 客户 端 和 服务 器 端 之 间 建 立 安全 的 连接 ， 任 
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何 规模 的 数据 都 可 以 在 此 连接 上 安全 地 传输 ， 但 是 S-HTTP 是 为 了 安全 传输 单个 报 文 而 设 
计 的 。 因 此 ， 可 以 将 SSL 和 S-HTTP 看 成 是 相互 补偿 的 技术 ， 而 不 是 相互 竞争 的 技术 。SSL 
和 S-HTTP 均 已 提交 Internet 工程 任务 小 组 (Internet Engineering Task Force, IETF), FF 
接纳 成 为 标准 。 根 据 约 定 ， 需 要 SSL 连接 的 网 页 请 求 以 https: 开头 (代替 http:)。 并 非 所 有 
的 Web 浏览 器 和 服务 器 都 文 持 SSL/S-HTTP 协议 。 

这 些 协议 基本 上 都 允许 浏览 器 和 服务 器 互相 认证 ， 以 保证 消息 流 的 安全 传输 。 利 用 密码 
技术 ， 例 如 加 密 与 数字 签名 ，SSL/S-HTTP 协议 能 够 : 

© 人 允许 Web 浏览 器 和 服务 器 相互 认证 。 

© 人 允许 网 站 的 所 有 者 实现 对 特殊 服务 器 、 目 录 、 文 件 或 服务 的 访问 控制 。 

e 允许 敏感 数据 (例如 信用 卡号 码 ) 在 浏览 器 和 服务 器 之 间 传 输 ， 并 且 对 第 三 方 不 可 用 。 

o 保证 浏览 器 和 服务 器 之 间 进 行 可 靠 的 数据 交换 ， 也 就 是 既 不 会 被 偶然 或 有 意 地 破坏 ， 

也 不 会 被 侦 听 截获 。 

利用 SSL 或 S-HTTP 协议 建立 安全 的 Web 会 话 时 ， 一 个 重要 的 组 件 就 是 数字 证 书 ， 
数字 证 书 如 前 所 述 。 如 果 没 有 权威 的 、 可 信赖 的 证 书 ，SSL 和 S-HTTP 根本 没有 安全 性 
A] Be 


20.5.7 ”安全 电子 交易 和 安全 交易 技术 


安全 电子 交易 (Secure Electronic Transaction, SET) 协议 是 一 种 开放 的 、 可 互 操作 的 标准 ， 
用 于 处 理 Internet 基于 信用 卡 电子 支付 的 交易 ， 是 由 Netscape, Microsoft, Visa, Mastercard. 
GTE, SAIC, Terisa Systems 和 VeriSign 共同 提出 的 。SET 的 目标 是 要 实现 Internet 的 基于 
信用 卡 的 电子 支付 交易 ， 使 其 如 同 在 零售 店 的 支付 一 样 简单 和 安全 。 为 了 保护 隐私 ， 将 交易 
过 程 进行 分 割 : 商家 可 以 看 到 的 信息 包括 客户 正在 购买 的 商品 信息 、 商 品 价格 和 是 否 已 经 成 
功 支付 ， 但 是 不 包括 客户 付款 的 方式 。 相 似 地 ， 信 用 卡 的 发 放 方 (例如 Visa) 可 以 得 知 商品 
的 销售 价格 ， 但 是 无 法 得 知 这 是 哪 一 种 商品 的 价格 。 

在 SET 中 ,证 书 得 到 了 广泛 的 应 用 ， 证 书 提 供 了 信用 卡 持 有 者 、 商 家 以 及 金融 机 构 之 
间 的 认证 ， 如 图 20-11 tas. Microsoft 和 Visa International 都 是 SET 规范 的 主要 制定 者 ， 
他 们 目前 提出 了 安全 交易 技术 (Secure Transaction Technology, STT) 协议 ， 目 的 是 为 了 解 
决 Internet 上 的 安全 银行 支付 问题 。STT 使 用 DES 信息 加 密 算 法 、RSA 银行 卡 信息 加 密 算 
法 以 及 对 所 有 交易 参与 方 的 强 认 证 。 


20.5.8 Java 安全 


在 29.7 节 我 们 将 说 明 Java 已 经 日 渐 成 为 一 种 重要 的 Web 开发 语言 。 建 议 对 Java HA 
悉 的 读者 在 学 习 本 节 之 前 先 阅读 29.7 1. 

安全 和 保密 是 Java 设计 的 整体 组 成 部 分 ，Java“ 沙 箱 ” (sandbox ) 能 够 确保 不 受信 任 的 、 
恶意 的 应 用 程序 无 法 访问 系统 资源 。Java 沙 箱 由 三 个 组 件 组 成 : 类 加 载 器 、 字 节 码 检验 种 和 
安全 管理 器 。 安 全 特性 是 由 Java 语言 和 Java 虚拟 机 (JVM) 提供 的 ， 由 编译 器 和 运行 系统 
执行 ; 保密 则 是 构筑 在 这 些 安全 层 上 的 一 种 策略 。 

Java 语言 的 两 种 安全 特性 都 与 强 类 型 以 及 无 用 内 存 自动 回收 相关 。 本 节 讨 论 其 他 两 种 特 
性 : 类 加 载 器 和 字 节 码 检 验 器 。 为 了 完整 地 讨论 Java 的 安全 ， 我 们 还 会 对 JVM 安全 管理 天 
进行 分 析 。 
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信用 卡 发 行者 


20-11 SET 交易 


MEAS 

FTN a ais a STN RT ts WY ESF RA ET EL Sb, HS FS A) AY OP CK E 
用 程序 /applet 是 否 危 及 系统 安全 。 名 字 空 间 是 一 种 层次 结构 ， 人 允许 JVM 基于 类 的 来 源 (本 
地 或 是 远程 ) 对 类 进行 分 组 。 类 加 载 器 禁止 来 自 “ 低 保护 级 ”名 字 空 间 的 类 替换 高 保护 级 名 
字 空 间 的 类 。 利 用 这 种 方法 ， 非 本 地 的 Java 类 就 无 法 调用 或 者 覆盖 本 地 Java 类 中 定义 的 文 
件 系统 的 WO 原 语 。 一 个 正在 执行 的 JVM 允许 有 多 个 同时 激活 的 类 加 载 器 ， 每 一 个 类 加 载 
are ACA 425 la). WARA Java 应 用 程序 通常 都 拥有 上 自己 的 类 加 载 咒 ， 它 们 都 是 基 
于 Sun 公司 的 模板 实现 的 ， 这 一 点 可 被 视 为 安全 模型 的 一 个 缺陷 。 但 是 ， 也 有 一 些 人 主张 这 
正 是 Java 的 强大 之 处 ， 因 为 它 使 得 系统 管理 员 能 够 实施 自己 (也许 更 加 严密 ) 的 安全 策略 。 
字 节 码 检验 器 

在 JVM 运行 应 用 程序 /applet 之 前 ， 首 先 要 对 代码 进行 检验 。 检 验 器 假设 所 有 的 代码 都 
会 危害 系统 安全 ， 需 要 执行 一 系列 的 检查 ， 包 括 执行 一 个 定理 证 明 器 。 典 型 的 检查 包括 : 

© 编译 后 的 代码 格式 是 否 正确 。 

e 内 部 堆栈 是 否 出 现 溢出 或 者 下 溢 。 

e 是 否 出 现 非法 的 数据 转换 (例如 ， 整 型 到 指针 类 型 的 转换 ) 一 一 为 了 确保 变量 无 法 访 

问 受 保护 的 内 存 区 域 。 
e 字 节 码 指令 是 否 拼 写 正确 。 
e 所 有 对 类 成 员 的 访问 是 否 有 效 。 


APT PLS 
Java 的 安全 策略 是 面向 应 用 程序 的 。 一 个 Java 应 用 ， 诸 如 一 个 支持 Java 的 Web N i 48 
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或 者 一 个 Web 服务 器 ， 自 己 定 义 并 实现 其 安全 策略 。 所 有 应 用 都 要 实现 自己 的 安全 管理 器 。 
支持 Java 的 Web 浏览 器 拥有 自己 的 applet 安全 管理 器 ， 此 浏览 器 下 载 的 所 有 applet 都 受制 
于 该 安全 策略 。 通 常 ， 安 全 管理 器 负责 对 那些 存在 潜在 “和 危险 ”的 方法 进行 运行 时 验证 ， 这 
些 方 法 包括 VO 请 求 、 网 络 访问 和 定义 新 类 加 载 句 ， 等 等 。 一 般 情 况 下 ， 对 下 载 的 applet 操 
作 时 有 如 下 限制 : 

e 禁止 读 写 客户 端 文件 系统 中 的 文件 。 这 项 规定 禁止 了 applet 在 客户 端 里 存储 持久 性 

数据 (例如 数据 库 )， 尽 管 数 据 可 以 发 送 回 主机 端 进行 存储 。 

e | 除了 提供 编译 过 的 “ .class ”文件 的 主机 外 ,禁止 与 其 他 计算 机 进行 网 络 连 接 。 即 允 
许 连 接 的 主机 要 么 是 发 出 HTML 网 页 的 主机 ， 要 么 是 在 applet 的 标签 CODEBASE 
参数 中 指明 的 主机 ， 优 先 连接 CODEBASE 指明 的 主机 。 
禁止 在 客户 端 启动 其 他 程序 。 

o 禁止 加 载 库 文件 。 

e 禁止 定义 方法 调用 。 如 果 人 允许 applet 定义 本 地 方法 调用 ， 将 会 导致 applet 对 底层 操 

作 系 统 的 直接 访问 。 

无 论 是 从 公共 Internet 或 者 公司 内 联网 上 下 载 的 applet， 上 述 规定 均 适 用 。 但 是 对 于 客 
户 端 本 地 磁盘 上 的 applet 和 出 现在 客户 端 CLASSPATH 参数 指定 目录 下 的 applet， 上 述 限制 
则 不 适用 。 本 地 applet 是 由 文件 系统 加 载 器 加 载 的 ， 能 人 够 读 写 文件 ， 也 人 允许 退出 虚拟 机 ， 且 
不 必 通 过 字 节 码 检 验 希 。JDK (Java 语言 开发 工具 包 ) Appletviewer 对 这 些 限 制 有 所 放松 ， 
允许 用 户 目 定义 一 个 下 载 的 applet 能 够 访问 的 文件 列表 。 同 样 ， 微 软 的 IE 4.0 引 入 了 “区 
i” (zone) 的 概念 ， 一 些 区 域 是 可 信任 的 ， 而 另 一 些 则 是 不 可 信任 的 ， 从 某 些 区 域 下 载 的 
applet 就 能 够 谈 取 客户 闪 便 盘 驱 动 硕 上 的 文件 。 这 些 区 域 划 分 由 网 络 管理 员 来 决定 。 
增强 的 applet 安全 

1996 年 1 H, Æ Java applet API 的 第 一 个 版 本 中 引入 了 沙 箱 模 型 。 虽 然 这 个 模型 通常 
能 够 保护 系统 免 受 网 络 上 不 信任 代码 可 能 的 攻击 ， 但 是 它 并 不 能 解决 许多 其 他 的 安全 和 隐私 
问题 。applet 来 源 的 真实 性 需要 通过 认证 来 保证 。 经 过 数字 签名 和 认证 的 applet 就 升级 为 可 
信任 的 applet， 因 而 在 允许 时 也 就 受到 较 少 的 安全 限制 。 

JDK 1.1 支持 的 Java KE API 包括 数字 签名 、 报 文摘 要 、 密 钥 管 理 和 加 密 /解密 《符合 
美国 出 口 控制 规定 ) 的 API。 目 前 ， 为 签名 applet 的 灵活 安全 策略 制定 一 个 基础 架构 的 工作 
正在 进行 中 。 


20.5.9 ActiveX 安全 


ActiveX 的 安全 模型 与 Java applet 的 安全 模型 有 很 大 的 不 同 。Java 通过 将 applet 的 行为 
限制 在 一 个 安全 的 指令 集 范 围 内 来 保证 安全 ， 而 ActiveX 并 不 限制 ActiveX 控件 的 行为 。 每 
一 个 ActiveX 控件 可 被 其 制作 者 使 用 Authenticode ”系统 进行 数字 签名 ， 然 后 数字 签名 再 经 
由 认证 中 心 (CA) WHE. ActiveX 安全 模型 将 计算 机 安全 的 责任 交 给 了 有 用户。 浏览 器 在 下 载 
未 被 签名 的 或 者 来 自 某 未 知 CA 认证 的 Activex 控件 之 前 ， 将 弹出 对 话 框 提 醒 用 户 此 次 操作 
可 能 是 不 安全 的 。 用 户 可 以 选择 放弃 或 者 继续 运行 该 ActiveX 控件 并 承担 其 后 果 。 


20.6 ”数据 管理 与 数据 库 管 理 
数据 管理 员 (DA) 负责 管理 和 控制 组 织 机 构 的 数据 ， 而 数据 库 管理 员 (DBA) 负责 管理 
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和 控制 组 织 机 构 的 数据 库 。DA 的 活动 主要 集中 在 生命 周期 的 前 期 阶段 一 一 从 数据 库 规划 到 
逻辑 数据 库 设 计 。DBA 则 更 关注 生命 周期 的 后 期 阶段 一 一 从 应 用 程序 设计 或 物理 数据 库 设 
计 阶 段 开 始 直 至 运行 维护 阶段 。 在 本 章 最 后 一 节 ， 我 们 将 讨论 与 数据 和 数据 库 管 理 有 关 的 目 
的 和 任务 。 


20.6.1 数据 管理 


数据 管理 | 管理 数据 资源 ， 包 括 数据 库 规划 ， 标 准 、 策 略 、 过 程 的 建立 及 维护 ， 以 及 概念 
数据 库 设 计 和 逻辑 数据 库 设 计 。 


DA 对 组 织 机 构 的 数据 资源 负责 ， 包 括 那些 未 存 人 计算 机 的 数据 ， 实 际 上 ，DA 经 常 管 
理 的 是 由 多 个 用 户 或 组 织 机 构 内 多 个 应 用 部 门 共享 的 数据 。DA 负责 同 资深 管理 层 人 员 协 商 
并 提出 建议 ， 以 确保 数据 库 技术 的 应 用 始终 能 够 支持 组 织 机 构 的 目标 。 在 一 些 组 织 机 构 中 ， 
数据 管理 是 一 个 独立 的 职能 部 门 ， 在 男 一 些 组 织 机 构 中 则 与 数据 库 管 理 合并 。 表 20-3 描述 
了 与 数据 管理 相关 的 任务 。 


R 20-3 数据 管理 的 任务 
选择 合适 且 高 生产 率 的 工具 
协助 组 织 机 构 IT/IS 的 开发 和 组 织 机 构 策略 的 制定 
承担 可 行 性 研究 ， 对 数据 库 开 发 进行 规划 
建立 单位 的 数据 模型 
确定 组 织 机 构 数据 需求 
建立 数据 收集 的 标准 并 定义 数据 格式 
估计 数据 容量 及 其 增长 速度 
定义 数据 使 用 模式 和 使 用 频率 
定义 数据 访问 需求 ， 确 保 赛 括 了 单位 所 有 合法 的 需求 
承担 概念 数据 库 设 计 和 逻辑 数据 库 设计 
及 时 与 数据 库 管 理 员 和 应 用 开发 人 员 进行 交流 ， 确 保 应 用 程序 满足 所 有 已 定义 的 需求 
对 用 户 进行 培训 ， 使 其 了 解数 据 标 准 和 法 律 责 任 
紧 跟 IT/IS 和 组 织 机 构 发 展 的 动向 
确保 文档 的 及 时 更 新 与 文档 的 完整 ， 包 括 标准 、 策 略 、 过 程 、 数 据 字典 的 使 用 以 及 终端 用 户 的 控制 
管理 数据 字典 
同 用 户 交 流 以 确定 新 的 需求 ， 解 决 与 数据 访问 和 性 能 相关 的 问题 
制定 安全 策略 


20.6.2 ”数据库 管理 


数据 库 管 理 | 对 数据 库 系统 的 物理 实现 进行 管理 ， 包 括 物理 数据 库 设计 与 实现 ， 建 立 安 全 
机 制 与 实施 完整 性 控制 ， 监 控 系 统 性 能 ， 并 在 必要 时 对 数据 库 进 行 重组 。 


与 数据 管理 员 相 比 ， 数 据 库 管 理 员 的 技术 性 更 强 ， 需 要 有 DBMS 和 操作 系统 的 专业 知 
识 。 尽 管 数据 库 管理 员 的 主要 职责 集中 在 充分 利用 DBMS 软件 进行 系统 开发 和 系统 维护 ， 
但 是 DBA 也 要 在 其 他 方面 协助 DA， 如 表 20-4 所 示 。 参 与 数据 库 管 理 的 人 数 是 变化 的 ， 通 
常 由 系统 的 规模 确定 。 表 20-4 种 描述 了 数据 库 管理 的 任务 。 
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表 20-4 数据库 管 理 的 任务 


评估 并 选择 DBMS 产品 

承担 物理 数据 库 设 计 

在 目标 DBMS 上 实现 物理 数据 库 的 设计 

建立 安全 机 制 ， 实 施 完整 性 约束 

与 数据 库 应 用 程序 开发 人 员 进 行 交 流 

制定 测试 策略 

对 用 户 进行 培训 

负责 对 最 终 实现 的 数据 库 系统 签署 交付 

监控 系统 性 能 ， 在 适当 的 时 机 对 数据 库 进 行 调 优 
定期 执行 备份 

确保 恢复 机 制 和 恢复 过 程 的 正确 性 

确保 文档 的 完整 ， 包 括 内 部 产生 的 材料 

关注 软件 和 硬件 的 最 新 发 展 以 及 市 场 报 价 ， 必 要 时 进行 升级 换代 


206.3 数据 管理 与 数据 库 管理 的 比较 


在 前 两 节 中 ， 我 们 已 经 研究 了 数据 管理 和 数据 库 管理 的 目的 和 任务 ， 最 后 再 把 它们 做 个 
简要 的 对 比 。 表 20-5 总 结 了 数据 管理 员 和 数据 库 管 理 员 在 主要 任务 上 的 不 同 。 可 能 最 明显 
的 区 别 在 于 所 做 工作 的 本 身 的 性 质 : 数据 管理 员 趋向 于 管理 型 ， 而 数据 库 管 理 员 更 趋 问 于 技 


术 型 。 
R 20-5 数据 管理 员 和 数据 库 管理 员 一 一 职责 的 主要 区 别 
数据 管理 数据 库 管 理 
参与 IS 策略 的 制定 评估 新 的 DBMS 
决定 长 期 目标 执行 计划 以 达成 目标 
制定 标准 、 策 略 和 过 程 实施 标准 、 策 略 和 过 程 
定义 数据 需求 实现 数据 需求 
完成 概念 数据 库 设 计 和 逻辑 数据 库 设 计 完成 逻辑 数据 库 设 计 和 物理 数据 库 设 计 
建立 和 维护 组 织 机 构 数 据 模型 实现 物理 数据 库 设 计 
协调 系统 开发 监控 数据 库 
面向 管理 面向 技术 
与 DBMS 无 关 与 DBMS 相关 
本 章 小 结 
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数据 库 安全 是 保护 数据 库 免 受 有 意 或 无 意 威胁 的 机 制 。 数 据 库 安 全 关注 避免 下 列 情况 的 发 生 : 盗用 


和 假冒 、 破 坏 机 密 性 (秘密 性 和) 破坏 隐私 、 破 坏 完 整 性 、 破 坏 可 用 性。 


威胁 指 有 意 或 无 意 的 ， 可 能 会 对 系统 造成 负面 影响 的 ， 进 而 影响 组 织 机 构 运 作 的 任何 情况 或 事件 。 
e 多 用 户 环 境 下 基于 计算 机 的 安全 控制 包括 : 授权 、 访 问 控制 、 视 图 、 备 份 和 恢复 、 完 整 性 、 加 密 和 


RAID 技术 。 


授权 是 授予 一 个 主体 权利 或 者 权限 ， 使 其 能 够 实现 对 系统 或 者 系统 对 象 的 合法 访问 。 认 证 是 一 种 用 


来 判断 用 户 身 份 是 否 属实 的 机 制 。 
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多 数 商 用 DBMS 支持 一 种 叫 作 自主 访问 控制 (DAC) 的 方法 ，DAC 使 用 SQL 对 权限 进行 管理 。 
SQL 标准 通过 提供 GRANT Ail REVOKE 命令 实现 对 DAC 的 支持 。 一 些 商业 DBMS 还 支持 另外 一 
种 叫 作 强 制 访 问 控制 (MAC) 的 访问 控制 方法 。MAC 是 基于 系统 范围 的 策略 ， 用 户 无 法 更 改 。 在 
MAC F, 数据库 的 每 一 个 对 象 都 被 赋予 了 一 个 安全 级 别 ， 每 一 个 用 户 也 被 赋予 了 与 某 一 安全 级 别 
相对 应 的 一 个 访问 许可 级 别 ， 还 包括 用 户 对 数据 库 对 象 的 读 写 规则 。SQL 标准 中 并 不 包括 对 MAC 
的 支持 。 

视图 是 作用 于 基础 关系 的 一 个 或 多 个 关系 运算 的 动态 结果 ， 即 视图 就 是 这 些 关 系 运算 的 结果 关系 。 
视图 是 一 个 虚 关 系 ， 在 数据 库 中 并 不 实际 存在 ， 它 根据 某 个 用 户 的 请 求 并 在 请 求 那 一 刻 才 计算 产 
Æ, 视图 通过 向 某 些 用 户 隐藏 数据 库 部 分 信息 这 一 方式 ， 提供 了 强大 而 又 灵活 的 安全 机 制 。 

备份 是 周期 性 地 将 数据 库 、 日 志文 件 (可 能 还 有 程序 ) 复制 到 脱 机 的 存储 媒介 上 的 过 程 。 日 志 是 指 
保存 并 维护 将 数据 库 全 部 变化 都 记录 在 案 的 日 志文 件 ， 从 而 保证 在 出 现 故 障 时 能 够 有 效 地 进行 恢复 
的 过 程 。 

完整 性 约束 也 有 助 于 维护 数据 库 系统 的 安全 ， 完 整 性 约束 可 以 防止 非法 数据 的 生成 ， 从 而 避免 产生 
容易 误解 的 或 不 正确 的 结果 。 


e 加 密 是 使 用 特定 算法 对 数据 进行 编码 ， 使 得 任何 没有 解密 密 钥 的 程序 都 无 法 读 取 数 据 。 


云 计算 使 用 借助 网 络 提供 的 计算 机 软 、 硬 件 资源 ， 用 户 一 般 通过 Web 浏览 器 或 移动 应 用 来 访问 。 


e DBMS Microsoft Office Access 提供 了 四 种 方法 以 保证 数据 库 安全 ， 包 括 : 拆 分 数据 库 ， 为 数据 库 


设置 密码 ， 托 管 (启用 ) 数据 库 中 禁用 的 内 容 ， 以 及 打包 、 签 名 并 部 署 数据 库 。 

DBMS Oracle 提供 了 两 种 安全 机 制 : 系统 安全 和 数据 安全 。 系 统 安全 机 制 允许 为 打开 数据 库 设 置 
密码 ; 数据 安全 机 制 支持 用 户 级 安全 ， 可 以 对 用 户 能 够 读 取 和 更 新 的 数据 库 部 分 加 以 限定 。 

与 Web 上 的 DBMS 相关 的 安全 措施 包括 代理 服务 器 、 防 火 墙 、 报 文摘 要 算法 和 数字 签名 、 数 字 证 
书 、Kerberos、 安 全 套 接 字 层 (SSL) 和 安全 HTTP (S-HTTP)、 安 全 电子 交易 (SET) 和 安全 交易 技 
术 (SST), Java 安全 以 及 Activex 安全 。 

数据 管理 是 对 数据 资源 的 管理 ， 包 括 : 数据 库 规划 ， 标 准 、 策 略 、 过 程 的 建立 和 维护 ， 以 及 概念 数 
据 库 设 计 和 逻辑 数据 库 设 计 。 

数据 库 管理 是 对 数据 库 系统 的 物理 实现 进行 管理 ， 包 括 : 物理 数据 库 设计 与 实现 ， 建 立 安 全 机 制 与 
实施 完整 性 控制 ， 监 控 系 统 性 能 ， 并 在 必要 时 重组 数据 库 。 


思考 题 


20.1 解释 数据 库 安 全 的 作用 和 范围 。 
20.2 ”列举 影响 数据 库 系统 的 主要 威胁 ， 并 针对 每 一 种 威胁 描述 可 能 采取 的 措施 。 
20.3 ”从 数据 库 安 全 的 角度 解释 下 列 术 语 ; 


(a) 授权 

(b) 认证 

(c) 访问 控制 
(d) 视图 

(e) 备份 和 恢复 
(f) 完整 性 

(g) 加 密 

(h) RAID 技术 


20.4 讨论 自主 访问 控制 与 强制 访问 控制 。 
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20.5 描述 DBMS Microsoft Office Access 或 者 Oracle 的 安全 机 制 。 


20.6 ”描述 保证 Web 上 的 DBMS 安全 的 各 种 方法 。 


20.7 ”描述 云 计算 服务 以 及 其 中 涉及 的 数据 库 。 
20.8 ”描述 移动 应 用 和 设备 中 特殊 的 安全 度量 。 
20.9 数据 管理 的 任务 是 什么 ? 

20.10 数据库 管理 的 任务 是 什么 ? 


习题 


20.11 分 析 你 所 在 单位 使 用 的 DBMS， 列举 它 所 提供 的 安全 机 制 。 
20.12 ”列举 出 你 所 在 单位 对 从 Web 上 可 访问 的 DBMS 所 采用 的 安全 保障 机 制 。 
20.13 ”思考 第 11 章 给 出 的 DreamHome 案例 研究 ， 列 举 可 能 出 现 的 安全 威胁 ， 并 提出 相应 的 解决 


办 法 。 


20.14 考虑 附录 B.3 给 出 的 Wellmeadows Hospital 案例 研究 ， 列 举 可 能 出 现 的 安全 威胁 ， 并 提出 相应 


的 解决 办 法 。 


20.15 ”调查 一 下 在 你 的 组 织 机 构 或 单位 里 是 否 存在 独立 的 数据 管理 和 数据 库 管理 的 职能 部 门 。 如 果 确 


实 有 ， 描 述 各 自 的 组 织 、 责 任 和 任务 。 


20.16 ”描述 云 计 算 服 务 在 你 们 单位 的 使 用 情况 或 潜在 用 途 ， 列 出 潜在 的 威胁 、 和 危害 和 对 策 。 
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数据 管理 中 的 职业 、 法 律 与 道德 问题 





| 本 章 目标 
本 章 我 们 主要 学 习 : 
o 如 何 定义 JIT 中 的 道德 、IT 治理 (IT governance) 和 法 律 问题 
o 在 数据 和 数据 库 管理 员 面 对 的 问题 和 场景 中 ,如何 区 分 哪些 属 法 律 范畴 、 哪 些 属 IT 
治理 范畴 、 哪 些 属 道德 范畴 
e 新 的 规章 对 数据 和 数据 库 管 理 员 增加 了 哪些 要 求 和 责任 
像 萨 班 斯 -= 奥克斯 利 法 规 和 巴塞 尔 开 这 类 法 律 协议 ， 对 数据 和 数据 库 管 理 的 功能 有 
何 影响 
为 支持 审计 、IT 治理 和 遵守 规则 而 进行 的 一 些 最 好 的 准备 工作 
FIT 及 数据 与 数据 库 管 理 相关 的 知识 产权 CIP) 问题 


正如 第 20 章 讨 论 的 那样 ， 对 于 规模 不 断 增长 的 组 织 机 构 数 据 的 内 部 日 常 管控 问题 ， 数 
据 管 理 员 和 数据 库 管 理 员 似乎 还 能 胜任 。 然 而 ， 他 们 发 现 自己 正 陷 入 相对 陌生 的 、 有 关 法 律 
和 道德 守则 的 泥潭 。 仔 细 观 察 过 去 几 年 有 大 量 丑闻 曝光 的 公司 〈 例 如， 美国 的 安然 公司 和 世 
通 公 司 ， 欧 洲 的 由 玛 拉 特 公 司 )， 人 们 发 现 ， 随 着 一 些 新 的 法 律 和 规章 的 出 台 ， 组 织 机 构 的 
运作 方式 将 发 生 巨 大 变化 。 身 份 盗窃 案件 数量 的 上 升 可 能 引起 人 们 对 数据 管理 的 更 多 注意 。 
在 本 书 讨论 的 范畴 中 ,关于 IT 的 法 律 和 道德 影响 涉及 最 多 的 就 是 数据 管理 。 因 此 ， 本 章 的 
目标 是 首先 定义 基本 问题 ， 然 后 说 明 在 数据 管理 背景 下 这 些 问 题 的 面貌 ， 最 后 为 数据 和 数据 
库 管 理 员 提供 应 对 这 些 问 题 的 实际 措施 。 





本 章 伊 始 的 21.1 节 定 义 在 IT 的 范畴 中 什么 是 法 律 和 道德 问题 。21.2 节 讨 论 为 控制 这 些 
问题 应 建立 的 法 规 ， 并 着 重 说 明 它 们 对 数据 和 数据 库 管 理 功能 的 影响 。21.3 节 分 步 说 明 如 何 
建立 全 组 织 内 的 策略 和 过 程 ， 以 期 在 数据 管理 和 IT 治理 中 的 行为 能 够 合法 且 遵 守 道德 。 我 
们 针对 11.4 节 描 述 的 DreamHome 案例 研究 给 出 一 套 策略 。21.4 节 以 介绍 知识 产权 的 一 些 主 
要 概念 来 结束 本 章 。 


21.1 定义 IT 中 的 法 律 与 道德 问题 


让 我 们 先 想 一 想 ， 为 什么 在 一 本 关于 数据 库 系 统 的 教科 书 中 ， 要 用 一 章 来 讨论 法 律 IT 
治理 和 道德 问题 呢 ? 答案 很 简单 ， 世 界 各 地 的 公司 发 现 ， 他 们 不 得 不 越 来 越 多 地 回答 关于 其 
员工 的 行为 、 品 行 方 面 的 问题 。 与 此 同时 ， 人 们 需要 搞 清楚 何谓 职业 行为 ， 何 谓 非 职业 的 行 
为 。 此 外 ， A ES 更 高 效 ， 组 织 机 构 的 压力 不 断 增 大 ， 他 们 
要 不 断 宣 贯 相关 过 程 和 政策 。 
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21.1.1 定义 IT 中 的 道德 规范 

过 去 ，IT 员工 在 各 自 岗 位 上 为 单位 工作 ， 他 们 可 能 在 很 大 程度 上 感受 不 到 其 经 理 和 上 
司 各 种 行为 (可 能 含 违法 行为 ) 的 影响 。 毕 竟 ， 上 司 或 经 理 负责 单位 运作 ， 而 IT 工作 人 员 只 
是 简单 地 落实 他 们 的 指示 罢了 。 今 天 情形 不 再 如 此 。 随 着 大 规模 存储 和 处 理 能 力 的 增长 和 聚 
集 ，IT 对 单位 其 他 部 门 的 影响 逐步 增 大 ， 股 东 、 监 察 人 员 、 媒 体 和 单位 内 部 知情 人 的 监视 
不 断 ， 这 些 都 把 IT 员工 推 到 风口 浪 尖 。 例 如 ， 训 不 鲜 见 ， 一 个 小 型 电 商 轻易 就 能 积 提 若 干 
T 字 节 (102byte) 的 客户 点 击 流 (clickstream) 9 数据 。 金 融 服 务 公司 处 理 P 字 节 ( 10'byte) 
事务 ， 它 们 涉及 成 千 上 万 客户 和 公司 。 在 这 样 的 技术 背景 下 ，IT 部 门 要 负责 处 理 山 一 样 的 
数据 ， 以 期 为 公司 带 来 新 效益 。 正 像 第 20 章 讨 论 的 那样 ， 任 何 企图 盗用 者 〈 既 可 能 来 自 单 
位 内 部 ， 也 可 能 来 自 外 部 ) 都 会 发 现 如 此 大 量 的 数据 是 极其 诱 人 的 。 与 此 同时 ， 任 何 贪 禁 的 
管理 者 也 可 能 受到 诱惑 ， 突 破 道德 底线 地 使 用 商业 智能 技术 (我 们 将 在 第 31 一 34 章 讨 论 商 
业 智 能 技术 )。 目 前 ， 立 法 和 政府 的 管理 还 远 没 有 跟 上 技术 迅速 发 展 的 步伐 。 此 外 需要 说 明 
的 是 ， 判 断 是 否 违背 了 各 种 不 断 出 现 的 新 规章 本 身 也 要 求 进行 精确 的 数据 分 析 。 

我 们 首先 给 出 几 个 基本 定义 供 本 章 使 用 ， 并 列举 几 个 场景 以 说 明 一 些 出 色 的 实践 。 


| 道德 规范 | 一 组 正确 的 行为 准则 ， 或 者 一 套 道德 价值 理论 或 体系 。 


关于 道德 规范 有 许多 的 定义 ， 其 中 大 多 数 与 业务 或 技术 人 员 日 稼 面 对 的 都 有 差异 。 因 
此 ,我们 简单 地 认为 ， 所 谓 道德 的 行为 就 是 按 社 会 的 标准 “做 对 的 事情 ` 。 当 然 ， 这 可 能 又 
让 人 纠结 “ 谁 的 社会 ”这 一 问题 ， 在 一 种 文化 〈 国 家 、 地 区 或 宗教 ) 中 认为 道德 的 行为 可 能 
在 为 一 种 文化 中 就 是 不 道德 的 。 不 过 纠缠 这 样 的 争论 已 超出 本 书 的 范围 。 


21.1.2 ”道德 行为 与 合法 行为 的 差别 

另 一 个 容易 引起 混乱 的 地 方 是 道德 与 合法 的 对 比 。 我 们 可 能 认为 法 律 就 是 简单 地 强制 某 
些 符合 道德 的 行为 。 例 如 ， 大 多 数 人 都 认同 偷 别 人 东西 是 不 道德 的 。 足 够 多 的 人 内 心 接受 要 
“做 对 的 事情 ”这 条 标准 ， 其 实在 大 多 数 社会 的 法 律 中 也 强制 了 这 一 具体 的 道德 行为 。 这 样 
的 思维 方式 导出 两 个 熟悉 的 观点 : 符合 道德 的 就 是 合法 的 ， 不 道德 的 就 是 不 合法 的 。 有 许多 
例子 支持 这 样 的 主张 。 

然而 ， 这 样 的 主张 带 来 一 个 问题 : 所 有 不 道德 的 行为 都 是 违法 的 吗 ?” 假 设 DreamHome 
数据 库 系 统 中 有 一 名 孤独 的 数据 库 管理 员 ， 他 利用 其 具有 的 管理 员 访 问 权 限 ， 在 DreamHome 
数据 库 中 查找 这 样 一 些 客户 ， 其 申请 租房 的 模式 暴露 了 其 现 为 单身 。 这 是 个 很 好 的 例子 ， 事 
情 本 身 似 乎 不 违反 任何 法 律 ,但 公司 应 该 明确 这 是 不 道德 行为 。 

另 一 个 问题 是 ， 所 有 道德 的 行为 都 合法 吗 ? 例如 ， 考 虑 美国 证 券 交 易 委 员 会 Securities 
and Exchange Commission, SEC) 的 规制 国家 市 场 体系 (Regulation National Market System, 
Reg NMS)。 这 部 包罗 万 象 的 规则 的 目标 就 是 改变 美国 市 场 股 票 公平 交易 的 方式 。Reg NMS 
的 一 项 主张 称 为 “订单 保护 规则 ”， 说 的 是 对 于 一 宗 交 易 的 某 个 价格 ,假如 在 其 他 “快速 ” 
交易 和 市 场 上 还 有 更 好 的 价格 存在 (快速 市 场 指 能 在 亚 秒 内 完成 交易 )， 那 么 这 宗 交 易 便 不 
能 以 欠 佳 的 价格 成 交 。 例 如 ,假设 在 纽约 证 券 交 易 所 (NYSE) 有 50000 股 IBM 的 股票 正 以 
每 股 $80.15 的 价格 出 售 给 买主 ， 而 在 电子 交易 市 场 mstinet， 某 买主 以 每 股 $80.14 的 价格 仅 


O 点击 流 就 是 Web 或 应 用 日 志 ， 它 记录 了 用 户 何 时 点 击 了 网 页 或 应 用 中 的 哪个 链接 。 
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购买 300 股 。 根 据 Reg NMS 的 规定 ，NYSE 需 用 那个 较 低 的 价格 挂牌 上 市 。 可 是 ， 像 基金 
养老 金 一 类 大 的 投资 户 ， 交 易 额 大 、 流 动 性 高 ， 要 在 短 时 间 内 完成 买 、 卖 ， 即 使 比 同期 最 好 
价格 高 一 分 、 二 分 也 在 所 不 惜 。 原 因 是 ， 大 宗 买 卖 一 旦 出 现 ， 市 场 价格 就 会 波动 。 即 一 个 大 
的 洁 盘 会 迫 低 价格 (a large sell order will drive the price down)。 结 果 ， 一 个 本 打算 保证 所 有 
客户 能 用 最 优 价格 交易 的 Reg NMS， 却 把 对 一 个 金融 投资 商 来 说 道德 的 事变 为 对 其 代理 和 
接受 订单 的 交易 所 来 说 是 不 合法 的 事 了 , 即使 他 们 正在 受 客户 委托 行事 。 
实质 上 ， 道 德 领先 于 法 律 ， 实 际 生 活 中 的 道德 规范 帮助 确定 相关 的 法 律 是 否 应 出 台 。: 

技术 发 展 引 发 新 闻 题 ， 而 相应 的 法 律 还 没 跟 上 时 ， 一般 由 道德 规范 来 填补 这 个 空 日 。 


21.1.3 IT 中 的 道德 行为 


由 TechRepublic (techrepublic.com，CNET Networks 维护 的 一 个 面向 开 的 门户 网 
站 ) 发 起 的 一 项 调查 表明 ，57% 参与 调查 的 IT 工作 人 员 暗 示 被 上 司 要 求 做 了 不 道德 的 事 
( Thornberry，2002 )。 虽 然 该 项 调查 未 深究 具体 做 了 什么 ,但 很 显然 这 已 是 个 令 人 不 安 的 数 
字 。 大 多 数 人 认为 不 道德 (和 违法 ) 的 事 包 括 安 装 盗版 软件 (参见 21.4.5 节 )、 访 问 私人 信息 
和 泄露 交易 秘密 。 

还 有 一 类 数据 库 技术 叫 数据 仓库 和 数据 挖 气 ， 使 用 它 能 汇集 并 找 出 看 似 不 相关 数据 之 
间 的 联系 和 模式 。 这 样 的 商业 智能 工具 在 过 去 的 十 年 间 ， 伴随 着 处 理 能 力 和 存储 的 快速 进步 
得 到 长 足 的 发 展 ， 使 得 即使 一 个 中 小 规模 的 公司 都 能 负担 得 起 在 相当 细微 的 层面 上 分 析 客 户 
行为 。 

该 技术 当然 也 有 许多 明显 符合 道德 的 使 用 。 例 如 ， 把 嫌疑 犯 的 车 (从 视频 录像 中 识别 出 
车 牌 ) 与 其 在 ATM 取 钱 的 一 次 事务 联系 在 一 起 ， 可 证 明 其 在 犯罪 现场 。 当 然 ， 我 们 也 能 轻 
易 举 出 许多 场景 ， 它 们 违背 了 道德 和 隐私 标准 。 例 如 ， 假 设 你 是 一 名 数据 库 管理 员 ， 当 要 求 
你 实现 一 个 用 于 借款 应 用 的 模式 时 ， 却 要 求 必须 包括 申请 者 的 种 族 和 国籍 等 属性 。 

日 积 月 累 的 事件 带 来 更 大 范围 的 数据 收集 ， 比 如 打手 机 、 用 信用 卡 或 借 记 卡 购物 、 申 
请 贷款 、 经 过 自动 收费 站 或 地 铁 入 口 、 在 伦敦 市 内 驾驶 、 拜 访 医生 或 药店 ， 甚 至 简单 地 点 击 
Web 网 站 上 的 链接 都 会 产生 事务 日 志 ， 它 们 都 能 被 收集 、 连 接 并 挖掘 出 模式 ， 许 多 公司 和 政 
府 都 能 从 中 获 益 。 当 公司 受到 竞争 压力 时 ， 收 集 和 挖掘 数据 的 诱惑 就 会 更 大 。 

这 些 例 子 说 明 合法 的 行为 中 许多 是 不 道德 的 。 问 题 归 结 起 来 是 认识 到 这 样 一 个 事实 ， 尽 
管 随 着 IT 的 进步 ， 这 样 的 数据 分 析 已 成 为 可 能 ,但 政府 和 法 律 团体 还 没 认识 到 其 对 隐私 的 
潜在 威胁 ， 以 致 于 分 析 与 否 留 给 了 各 个 组 织 机 构 自 己 来 决定 ， 其 结果 完全 视 该 组 织 机 构 的 文 
化 和 它 对 道德 行为 的 认识 而 定 。21.3 节 将 展现 在 IT 人员 中 建立 道德 行为 文化 的 实践 。 

IT 治理 

正如 前 面 强 调 的 那样 ， 在 过 去 十 年 间 ， 组 织 机 构 内 的 IT 部门 变 得 越发 重要 ， 数 据 和 
IT 资源 对 其 他 部 门 的 影响 以 及 与 此 相关 联 的 业务 政策 ， 都 引 人 注 目地 变 为 促进 组 织 机 构 革 
新 、 高 效 和 增长 的 关键 因素 。 结果 是 ， 对 企业 IT 投资 多 少 成 为 董事 会 和 执行 机 构 主 要 关心 
的 问题 。 

2002 年 的 大 丑闻 使 人 们 猛 醒 ， 治 理 是 个 重要 的 问题 ， 要 采用 惯例 和 法 规 来 定义 组 织 机 
构 的 目标 、 规 则 并 监控 财务 和 法 人 行为 ， 以 保证 透明 地 达成 目标 。IT 治理 通常 以 在 责任 、 
决策 权 、IT 资源 的 管理 和 使 用 方面 的 优先 级 为 基础 ， 目 的 是 用 IT 保证 达到 组 织 机 构 的 业 
务 目 标 。 此 外 ，IT 治理 也 必须 极力 主张 立法 和 一 切 自 愿 制定 的 规章 、 标 准 和 惯例 ， 只 要 能 
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减少 非法 行为 、 改 进 效率 ， 以 及 减少 IT 故障 、 其 他 公司 的 攻击 、 国 家 基础 设施 故障 、 顾 客 
出 错 和 上 自然 环境 的 影响 带 来 的 风险 。 总 之 ,我们 提出 下 面 这 个 广泛 可 接受 的 IT 治理 的 定义 
(Weill and Ross, 2004). 


| IT 治理 | 用 于 指明 决策 权 和 责任 ， 以 鼓励 在 使 用 TT 时 能 有 期 望 的 行为 。 


21.2 若干 法 规 及 其 对 IT 功能 的 影响 


正如 上 一 节 叙 述 的 那样 ， 由 于 涉及 数据 收集 、 处 理 和 分 发 的 一 些 法 律 和 规划 的 引入 与 修 
改 ， 使 得 “合法 ”和 “符合 道德 ”之 间 的 界限 变 得 模糊 。 本 节 我 们 介绍 最 近 推 出 的 几 个 法 规 
以 及 它们 对 数据 和 数据 管理 功能 的 影响 。 


21.2.1 美国 证 券 交易 委员 会 (SEC) 推出 的 规制 国家 市 场 体 系 (NMS) 


在 之 前 谈论 貌似 道德 但 实际 上 不 合法 的 活动 时 ， 我 们 曾 提 到 过 SEC 的 规制 NMS 和 “ 订 
单 保护 规则 ”， 在 此 规则 下 本 来 投资 方 接受 的 活动 (用 较 低 的 价格 购买 了 大 宗 股 票 ) 被 认为 
是 非法 的 。 那 么 ， 实 施 该 法 规 后 ， 金 融 服 务 公司 必须 及 时 收集 市 场 数据 ， 用 以 说 明 在 交易 那 
一 刻 确实 没有 更 优惠 的 价格 。 因 此 ， 人 金融 服务 公司 的 数据 管理 员 都 应 该 知晓 这 个 法 规 ， 以 及 
它 对 公司 业务 的 影响 。 还 需 开 发 另外 的 数据 库 ， 把 贸易 活动 与 市 场 数 据 关 联 起 来 ， 还 要 有 专 
门 的 报表 工具 用 于 产生 证 实 报告 以 及 满足 SEC 调查 用 的 特别 报告 。 


21.2.2 HK - 奥克斯 利 法 案 、COBIT 和 COSO 


在 安然 、 世 通 、 帕 玛 拉 特 和 其 他 一 些 公 司 的 金融 丑 案 出 现 之 后 ， 美 国 和 欧洲 政府 都 颁 
布 了 法 规 ， 对 公司 如 何 形 成 董事 会 、 如 何 接受 审计 以 及 如 何 公 布 财务 状况 提出 严格 要 求 。 
在 美国 ， 这 个 法 规 就 是 萨 班 斯 - 奥克斯 利 法 案 2002 (The Sarbanes-Oxley Act, SOX), € 
也 适用 于 在 美国 上 市 的 欧洲 公司 。 虽 然 SOX 重点 关注 的 是 账目 和 财务 方面 的 问题 ， 但 数 
据 管理 、 数 据 库 及 应 用 的 审计 也 被 推 到 前 台 ， 因 为 公司 必须 证 明 它 们 的 财务 数据 是 真实 准 
确 的 。 从 数据 管理 员 的 角度 看 ，SOX 对 公司 财务 数据 的 保密 性 和 审计 增加 了 要 求 ， 而 这 些 
要 求实 际 影 响 到 数据 如 何 收集 、 处 理 、 保 护 ， 甚 至 包括 在 组 织 机 构 内 部 和 外 部 如 何 形成 报 
表 ， 等 等 。 


内 部 控制 | 组 织 机 构 采 用 的 一 组 规则 ， 以 保证 本 单位 制定 的 政策 和 流程 不 被 违反 、 数 据 安 
全 可 靠 且 业 务 运 转 高 效 。 


为 了 遵守 SOX， 公 司 必须 采用 正式 的 信息 管理 风险 控制 架构 。 两 个 重要 的 架构 是 下 
面 将 讨论 的 “信息 和 相关 技术 的 控制 目标 ”( Control Objectives for Information and related 
Technology，COBIT) 和 “全 国 反 虚假 财务 报告 委员 会 下 属 的 发 起 人 委员 会 ”( Committee of 
Sponsoring Organizations of the Treadway Commission, COSO), 

COBIT 于 1996 Æ H IT HEHA (TGI) 制定 ， 至 今 已 改版 四 次 ，COBIT 5 于 2012 年 
由 信息 系统 审计 和 控制 协会 (SACA) A ITG 联合 发 布 。ISACA 在 关于 COBIT 的 Web 网 站 
(www.isaca.org/cobit) 上 说 : 

COBIT 5 提供 一 个 综合 架构 ， 能 帮助 企 事业 单位 达到 管理 和 控制 单位 的 信息 和 技术 

资产 (IT) 的 目标 ……COBIT 5 使 得 单位 的 IT 能 以 整体 的 方式 管理 和 控制 ， 关 注 到 各 项 

业务 和 IT 的 责任 范围 ， 考 虑 内 部 与 外 部 投资 人 与 IT 相关 的 利益 。 
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COBIT 5 加 强 并 整合 了 架构 COBIT 4.1, Val IT 2.0 Ail Risk IT, M ISACA 的 I 开 保险 框 
48 (IT Assurance Framework, ITAF) 和 信息 安全 业务 模型 (the Business Model for Information 
Security, BMIS) 中 也 抽取 了 部 分 内 容 。 它 还 与 若干 架构 和 标准 结合 在 一 起 ， 包 括 : 信息 
技术 基础 设施 库 (Information Technology Infrastructure Library, ITIL), E| bx tn ME 4E AA 
( International Organization for Standardization, ISO), 3 H FE AIA A (Project Management 
Body of Knowledge, PMBOK), PRINCE2 和 开放 式 群 组 染 构 框 染 ( The Open Group Architecture 
Framework, TOGAF), 

COBIT 5 的 过 程 分 为 治理 和 管理 两 个 领域 。 这 两 个 领域 一 共 包 含 五 个 方面 和 37 个 过 程 。 
企业 IT 治理 (Governance of Enterprise IT) 


e 评估 (Evaluate)、 指 导 (Direct) 和 监视 (Monitor)(EDM )。 治 理 通过 下 面 的 措施 保 
证 企 事业 单位 的 目标 能 够 达成 : 评估 投资 者 的 需要 、 条 件 和 选择 ; 根据 优先 级 和 决 
策 分 析 结 果 确 定 发 展 方向 ; 监视 企业 是 否 沿 着 既定 的 方向 和 目标 运转 和 进步 。 这 个 
方面 包括 5 个 过 程 。 


EDM01 


EDM02 
EDM03 


保证 治理 架构 的 设置 与 维护 


保证 资源 优化 


保证 利益 投 送 保证 投资 者 透明 


BET TT ed 


企业 IT 管理 (Management of Enterprise IT) 
e 调 准 (Align), 4X (Plan) 和 组 织 (Organize) (APO), APO 涉及 信息 和 技术 的 使 
用 以 及 怎样 最 好 地 利用 它们 来 达成 组 织 机 构 的 目标 。 它 也 强调 组 织 机 构 基 础 性 IT 的 

投入 是 为 了 达到 最 优 的 效果 和 产生 最 大 的 效益 。 这 个 方面 有 13 个 过 程 : 


APO01 
APO02 
APO03 
APO04 
APO05 
APO06 
APO07 


D E 


监管 关系 
监管 服务 一 致 性 
监管 供 贷 商 
监管 质量 
监管 风险 
监管 安全 保密 


e 构建 (Build)、 获 取 (Acquire) 和 实现 (Implement) (BAI)。BAI 包括 识别 IT 需求 、 
获取 相关 技术 并 在 组 织 机 构 当 前 的 业务 过 程 中 实现 它 。 这 个 方面 有 10 个 过 程 : 


BAIO] 
BAI02 
BAIO3 
BAI04 
BAI05 


监管 变化 
监管 变化 的 认可 和 转变 
监管 知识 
监管 资产 
监管 配置 


e 交付 (Deliver)、 服 务 (Service) 和 支持 (Support)(DSS), DSS 覆盖 IT 的 交付 方面 ， 
包括 在 IT 系统 中 应 用 的 执行 和 结果 ， 以 及 能 使 这 些 IT 系统 有 效 且 高 效 执行 的 支撑 
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过 程 。 这 个 方面 有 6 THE: 


DSS01 监管 操作 监管 持续 性 
DSS02 监管 服务 请 求 和 突 发 事件 监管 安全 服务 
DSS03 监管 问题 ”DSS06 | 。 监管 业务 过 程控 抽 


e 监控 (Monitor)、 评 价 (Evaluate) 和 评定 (Assess)( MEA), MEA 考虑 组 织 机 构 有 
关 评 定 其 目 身 需要 、 评 定 当 前 IT 系统 是 否 达 到 设计 时 的 目标 以 及 为 遵守 规定 的 要 求 
是 否 有 必要 的 控制 等 方面 的 策略 。 监 控 还 包括 一 个 由 内 、 外 审计 员 实 施 的 独立 评估 ， 
主要 是 针对 IT 系统 满足 业务 目标 的 能 力 和 组 织 机 构 的 控制 过 程 。 这 个 方面 有 3 个 


过 程 : 
MEAOI 监控 、 评 价 以 及 评定 性 能 和 一 致 性 
MEA02 监控 、 评 价 和 评定 内 部 控制 体系 
MEA03 评价 和 评定 对 外 部 要 求 的 服从 


男 一 方面 COSO 染 构 更 多 地 集中 在 内 部 控制 ， 由 下 面 五 个 部 分 组 成 : 

e 控制 环境 : 建立 一 种 受 控 、 有 责任 、 行 为 符合 道德 的 文化 。 

e 风险 评定 : 评估 实现 组 织 机 构 的 目标 所 面临 的 风险 。 

o 控制 活动 : 实现 为 降低 风险 而 做 的 必要 的 控制 。 

e 信息 和 通信 : 说 明 在 组 织 机 构 内 部 以 及 与 合作 伙伴 之 间 报 告 和 通信 的 途径 。 

o 监控 : 评估 所 设置 控制 的 有 效 性 。， 

显然 ,数据 管 理 员 应 该 直接 参与 每 一 部 分 的 工作 。 在 大 型 组 织 机 构 中 ， 这 意味 着 与 高 层 
管理 者 密切 接触 ， 使 他 们 了 解 从 IT 的 角度 看 实现 这 些 控制 的 意义 。 一些 重要 的 资源 (新 的 
软件 、 便 件 、 数 据 库 、 培 训 和 新 人 员 ) 也 需要 游说 才能 获得 。 

值得 注意 的 是 ，COBIT 虽然 为 组 织 机 构 提 供 了 关于 策略 和 标准 方面 的 指南 ， 但 对 于 在 
过 程 中 如 何 实现 它们 以 及 如 何 为 这 些 指 南 设计 支撑 结构 方面 却 未 给 出 建议 ， 这 要 求 组 织 机 构 
目 己 来 解释 执行 。 


21.2.3 ”健康 保险 流通 和 责任 法 案 (HIPAA) 


由 美国 卫生 部 出 台 的 健康 保险 流通 和 责任 法 案 (HIPAA) 1996， 对 所 有 卫生 保健 和 健康 
保险 的 提供 者 均 有 影响 。 该 法 案 的 规定 正在 分 期 分 批 实 施 ， 各 卫生 保健 提供 商 的 最 后 期 限 
视 其 规模 和 类 型 而 定 。 该 法 案 有 几 条 主要 的 规定 ， 下 面 五 条 是 与 数据 库 管 理 有 直接 重要 关 
AN: 

(1) 病人 信息 的 私密 性 (2003 年 4 月 后 对 大 多 数组 织 机 构 强 制 执行 )。 病 人 现在 要 正式 

签署 同意 书后 ， 他 的 卫生 保健 提供 商 才能 将 其 医疗 信息 共享 给 其 他 提供 商 或 保险 公 
司 。 因 此 ， 数 据 管理 员 必 须 保 证 ， 在 数据 库 和 系统 中 保存 好 病人 的 意见 书 ， 并 据 此 
同意 或 拒绝 传送 数据 (无 论 是 电子 的 还 是 纸 质 的 )。 

(2) 各 个 卫生 保健 组 织 机 构 间 电子 保健 /医疗 记录 和 交易 的 标准 化 (2003 年 10 月 后 强 

制 执行 )。 开 发 了 一 系列 标准 ， 有 覆盖 了 诸如 索赔 、 登 记 、 病 人 资格 和 付款 等 典型 的 
医疗 保健 交易 。 对 于 数据 管理 员 ， 这 意味 着 要 改变 本 单位 的 数据 模型 ， 另 外 加 入 一 
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些 属性 ， 并 与 电子 数据 交换 软件 (EDIS) 提供 商 一 道 努 力 ， 保 证 保健 数据 能 以 标准 
的 格式 在 组 织 机 构 间 传递 。 

(3) 为 员工 建立 全 国 范围 内 可 识别 的 身份 标识 ， 用 于 员工 保健 计划 (2004 年 7 月 大 多 
数组 织 机 构 开 始 执行 )。 这 个 标识 (不 是 社会 保险 号 ) 以 后 还 会 用 于 保健 组 织 之 间 的 
所 有 交易 。 同 样 ， 数 据 管理 员 需 要 修改 单位 的 数据 模型 ， 增 加 这 些 可 选 的 标识 。 

(4) 关于 病人 数据 和 涉及 这 些 数据 的 交易 的 保密 标准 (2005 年 4 月 大 多 数组 织 机 构 开 
始 执行 )。 必 须 保 证 病人 数据 在 数据 库 中 和 在 机 构 之 间 传 递 时 的 安 人 全。 泄密 病人 数 
据 要 面临 大 额 罚 球 。Oracle 和 IBM 这 些 数 据 库 生产 商都 提供 了 加 密 工 具 ， 能 对 数 
据 库 表 的 列 数据 加 密 ， 此 外 还 提供 机 制 对 数据 库 事务 进行 精细 的 审计 。 

(5) 为 卫生 保健 机 构 和 个 人 提供 商 建 立 全 国 范围 内 可 识别 的 标识 。 这 项 规定 的 含义 与 前 
面 说 到 的 标准 化 员工 喘 份 标识 是 类 似 的。 


21.2.4 欧盟 数据 保护 法 令 1995 


欧盟 数据 保护 法 令 正 式 的 标题 是 “欧洲 议会 和 委员 会 1995 年 10 月 24 目 关 于 在 个 人 数 
据 处 理 中 个 体 的 保护 及 这 类 数据 自由 移动 方面 的 法 令 95/46/EC”(OJEC，1995 )。 这 个 1995 
年 由 欧盟 成 员 国 采用 的 法 令 奢 括 34 个 条 款 ， 也 许 是 当今 世界 所 有 类 似 法 令 和 法 规 中 最 庞杂 
的 了 。 全 面 深 人 研究 这 部 法 令 已 超出 本 书 范围 ， 但 其 中 某 些 条 款 还 是 值得 关注 : 
© RA 6 和 条 款 7 包含 十 一 条 要 求 ， 其 中 的 八条 要 求 用 作 下 节 将 讨论 的 英国 数据 保护 
规范 的 基础 。 
© 条 款 8 集中 在 处 理 那些 暴露 个 人 种 族 、 政 治 倾向 、 宗 教 信仰 、 所 属 工会 的 数据 和 处 
理 涉 及 健康 和 性 生活 的 数据 。 这 样 的 处 理 活动 一 般 是 禁止 的 ,但 有 10 种 情况 例外 ， 
包括 主体 本 身 人 允许、 法律 规定 的 处 理 以 及 所 做 处 理 是 与 行业 功能 相 一 致 的 ， 等 等 。 
e 条 款 10、11 和 12 是 关于 如 何 收集 数据 的 ， 以 及 个 人 有 查看 并 认可 数据 正确 与 否 的 权利 。 
© ARK 16 MAR 17 是 关于 数据 在 收集 和 处 理 过 程 中 机 密 性 和 安全 性 的 度量 。 
© AK 18 ~ 21 涉及 一 个 处 理 者 如 何 告知 他 的 欧盟 成 员 ， 他 处 理 数据 的 意图 以 及 在 什 
么 情形 下 该 成 员 应 该 传播 这 个 处 理 操作 。 
这 部 欧盟 法 令 建 立 在 下 面 七 条 原则 之 上 : 
通告 主体 : 收集 其 数据 时 ， 主 体 应 被 告知 。 
用 途 确定 : 所 收集 的 数据 应 该 仅 用 于 所 叙述 的 用 途 ， 而 不 能 作 他 用 。 
征 得 许可 : 未 征 得 主体 同意 ， 个 人 数据 不 得 透露 给 第 三 方 或 与 其 共享 。 
保障 安全 : 个 人 数据 一 经 收集 ， 须 保证 其 安全 保密 ， 防 止 滥 用 、 盗 用 和 丢失 。 
信息 公开 : 其 个 人 数据 正 被 收集 的 主体 应 被 告知 收集 者 的 相关 情况 。 
授权 访问 : 主体 应 有 权 访问 他 们 个 人 的 数据 并 允许 纠正 不 实 之 处 。 
责任 与 义务 : 主体 应 能 约束 个 人 数据 收集 者 ， 使 其 有 责任 和 义务 遵守 这 些 原则 。 
在 该 法 令 中 , 个 人 数据 意味 着 任何 与 一 个 被 标识 或 可 标识 的 自然 人 (数据 主体 ) 相关 的 
信息 ; 一 个 可 标识 的 人 是 指 他 能 直接 或 间接 地 被 标识 ， 有 具体 可 能 通过 标识 号 或 者 通过 他 的 一 
个 或 多 个 身体 、 和 生理、 心理 、 经 济 、 文 化 和 社会 特征 (条款 2a)。 数 据 被 考虑 为 个 人 数据 的 
依据 是 ， 任 何人 都 会 把 它 与 一 个 特定 的 人 联系 在 一 起 ， 即 使 数据 持 有 者 本 身 都 未 意识 到 这 种 


O EDI 是 网 上 计算 机 到 计算 机 的 业务 数据 交换 标准 ， 典 型 的 事务 包括 采购 订单 、 发 票 和 付款 等 。 
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关联 。 这 类 数据 的 例子 有 ， 地 址 、 银 行 对 账单 、 信 用 卡号 等 。 个 人 数据 的 处 理 也 被 广泛 地 定 
义 ， 涉 及 手工 和 自动 的 操作 ,包括 收 集 、 录 制 、 组 织 、 存 储 、 修 改 、 检 索 、 使 用 、 传 递 、 分 
发 或 发 布 ， 甚 至 分 块 、 探 除 或 破坏 (条款 2b)。 这 部 法 令 不 但 适用 于 驻扎 或 运转 在 欧盟 的 控 
制 者 ， 而 且 对 那些 使 用 安装 在 欧盟 境内 的 设备 处 理 个 人 数据 的 控制 者 也 同样 有 效 。 因 此 ， 欧 
盟 之 外 的 组 织 机 构 只 要 在 欧盟 境内 处 理 个 人 数据 就 必须 遵从 这 部 法 令 。 

2012 年 1 月， 欧盟 委员 会 披露 要 创建 一 部 单独 的 欧洲 数据 保护 法 律 ， 适 用 欧盟 所 有 成 
员 国 。 打 算 做 下 列 修改 : 

e 适用 性 扩 至 所 有 非 欧 洲 的 公司 ， 只 要 其 数据 处 理 在 欧洲 境内 进行 就 受 此 法 律 制 裁 。 

© 必须 声明 同意 机 制 。 因 此 对 任何 个 人 数据 的 处 理 ， 将 要 求 向 涉及 的 个 人 提供 清晰 的 

信息 ， 并 要 从 个 人 那里 得 到 明确 的 许可 ， 才 能 处 理 他 们 的 数据 。 

© 使 得 在 欧盟 外 (包括 在 云 中 ) 数据 安全 传输 更 容易 ， 只 要 当事人 承 详 遵 守 共 同 规则 。 

© 新 增 私有 权利 ,将 在 欧盟 建立 数据 主体 的 “携带 权 ” 和 “遗忘 权 ”。 携 沉 权 允许 在 有 
要 求 时 ， 所 有 数据 可 以 从 一 个 提供 者 转移 到 男 一 个 提供 者 ， 例 如 传输 一 部 社会 媒体 
简介 ， 而 遗 饼 权 允 许 人 们 擦 除 历史 数据 。 
十 三 岁 以 下 个 人 的 数据 通常 须 征 得 父母 同意 ， 这 使 得 公司 更 难 开展 针对 未 成 年 人 的 业务 。 
当 公 司 发 现 数据 保护 法 规 遭 到 破坏 或 数据 被 泄露 时 ， 应 在 24 小 时 内 通知 欧盟 数据 保 


护 当 局 和 数据 涉及 的 个 人 。 
o 严厉 制裁 违反 欧 共 体 数 据 保护 法 的 行为 ， 对 于 严重 的 破坏 行为 罚款 高 达 公 司 全 球 洛 
业 额 的 2%。 


21.2.5 ”英国 数据 保护 法 令 (DPA) 1998 


英国 数据 保护 法 令 (DPA) 1998 (OPSI, 1998) 的 意图 是 维护 表 21-1 中 的 八条 数据 保护 
原则 。 这 八条 是 从 欧盟 数据 保护 法 令 1995 中 借用 而 来 的 。 在 此 法 规 下 ， 公 民有 权 要 求 查看 
任何 组 织 机 构 保 存 的 有 关 他 的 数据 副本 ， 并 能 更 正 其 中 的 错误 。 收 集 和 维护 这 些 数据 的 组 织 
机 构 必 须 有 清晰 的 政策 ， 即 明确 如 何 响应 查看 数据 的 请 求 和 与 其 他 组 织 共享 数据 的 请 求 。 这 
些 策略 显然 需要 与 本 法 规 和 该 组 织 机 构 的 道德 标准 相 协 调 。 


R 21-1 英国 数据 法 规 1998 (OPSI，1998 ) 


(1) 个 人 数据 应 诚实 、 合 法 地 被 处 理 ， 具 体 地 说 ， 除 非 经 过 同意 或 有 必要 ， 和 否则 不 应 被 处 理 。 处 理 时 必要 的 条 件 
都 详尽 地 列 在 本 法 规 的 清单 2 和 清单 3 中 。 

(2) 个 人 数据 应 因 某 种 明确 合法 的 用 途 而 获取 ， 并 且 不 应 该 以 任何 与 这 个 或 这 些 用 途 不 相 容 的 方式 做 进一步 处 理 。 

(3 ) 为 某 个 或 某 些 用 途 而 处 理 的 个 人 数据 应 该 是 足够 、 相 关 和 不 过 多 的 。 

(4) 个 人 数据 应 该 精确 ， 必 要 时 还 应 为 最 新 的 。 

(5 ) 为 某 个 或 某 些 用 途 处 理 的 个 人 数据 ， 当 用 途 不 再 需要 后 数据 也 不 应 再 保留 。 

(6) 处 理 个 人 数据 时 应 与 在 该 法 规 下 数据 主体 的 权利 一 致 。 

(7 ) 应 有 合适 的 技术 和 组 织 手 段 以 检测 非 授 权 或 非法 的 个 人 数据 处 理 ， 以 及 个 人 数据 的 意外 丢失 、 被 破坏 或 损坏 。 

(8) 个 人 数据 不 应 传送 到 欧盟 以 外 的 国家 和 地 区 ， 除 非 该 国家 和 地 区 保证 对 数据 主体 关于 个 人 数据 处 理 的 权利 和 
自由 提供 了 一 个 合适 级 别 的 保护 。 


21.26 ”信息 访问 法 规 


据 专 门 监督 和 游说 信息 权 法 的 组 织 RighttoInfo.org 披露 ， 截 止 到 2012 年 1 月， 超过 90 
个 国家 已 立法 ， 提 供 公 众 访问 政府 持 有 信息 的 权利 和 流程 。1766 年 ， 瑞 典 成 为 第 一 个 建立 
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信息 访问 法 的 国家 ， 随 后 是 芬兰 (1951 Æ) 和 美国 ( 1966 年 )， 剩 下 的 国家 都 是 近 50 年 内 
才 立 法 。 促 使 这 些 类 似 于 DPA 的 法 规 出 台 ， 主 要 是 为 了 增 大 政府 机 构 的 透明 度 和 责任 义务 。 
对 于 某 些 国家 ， 还 能 减少 腐败 ， 鼓 励 正 规 、 合 法 地 行使 职权 。 

英国 建立 了 信息 自由 法 2000 (FOIA) 和 (苏格兰 ) 信息 自由 法 2002 (FOISA)。 这 使 得 
该 国 任何 公民 有 权 访 问 政府 机 构 持 有 的 大 量 信 息 ， 从 医院 、 应 急 服务 机 构 到 地 方 当 局 、 中 央 
政府 和 高 等 学 府 。 这 部 法 规 由 八 个 部 分 的 条 款 构 成 ， 它 与 DPA 1998 A—Ma MB. K 21-2 
给 出 前 两 部 分 ， 它 是 整个 法 规 的 概要 。 


表 21-2 ”英国 信息 自由 法 2000 节选 

部 分 1- 访问 政府 机 构 持 有 的 信息 

。 规定 对 政府 机 构 持 有 记录 信息 的 一 般 访 问 权 ， 事 先 说 明 在 什么 条 件 下 ， 一 个 机 构 必 须 接受 访问 请 求 。 

© 根据 第 一 节 列 出 的 责任 和 义务 描述 部 分 2 中 各 项 窜 免 的 效果 。 

。 规定 该 法 规 覆 盖 团 体 、 个 人 或 在 清单 1 中 指定 的 政府 部 门 和 公有 公司 ， 并 有 权 进 一 步 指定 政府 机 构 受 其 约束 。 

© 人 允许 政府 机 构 按 国 务 大 臣 指 定 的 规定 收费 。 

。 提 供 接受 请 求 的 时 段 限 制 。 

。 制定 特别 条 款 ， 针 对 传 到 公共 记录 办 公 室 (the Public Record Office) 的 那些 公共 记录 ， 等 等 。 

© 要求 政府 机 构 为 申请 者 提供 建议 和 帮助 。 

。 要求 政府 机 构 说 明 拒 绝 一 个 请 求 的 依据 。 

se 重新 命名 数据 保护 官 (the Data Protection Commissioner) 和 数据 保护 特别 法 庭 (Data Protection Tribunal) (以 及 
后 续 对 清单 2 中 指定 的 其 他 一 些 法 规 的 修改 )。 

。 要 求 政府 机 构 采 用 并 维持 一 个 消息 发 布 模式 ， 并 照 该 模式 发 布 消息 。 

部 分 2- 豁免 信息 

。 设置 哪些 信息 属于 “ 抢 免 信息 " (exempt information) 的 情况 。 

Part 4- 强制 执行 

。 当 申请 者 不 满意 政府 机 构 对 其 信息 请 求 的 答复 时 ， 他 可 以 要 求 署 长 (the Commissioner) 判定 该 机 构 是 否 依法 行 
事 。 例 如 ， 署 长 有 义务 判决 到 底 是 受制 于 某 些 条 件 ， 还 是 手段 疲乏 。 

。 描述 署 长 具有 的 调查 权 和 强制 权 。 这 肯定 了 任何 政府 机 构 都 不 能 做 有 违 这 部 法 规 的 事 。 这 部 分 还 规定 了 这 样 的 
情形 ， 此 时 可 以 由 一 个 值得 信任 的 人 (an accountable person) 发 放 证 书 ， 该 证 书 专门 针对 署 长 公布 的 关于 竹 免 
信息 的 判决 通知 书 和 实施 通知 书 。 该 证 书 的 用 途 就 是 使 一 个 政府 机 构 可 以 不 必 理 皮 署 长 的 通知 书 。 


英国 的 信息 自由 法 是 由 信息 官 强制 推行 的 ， 他 们 建议 了 一 个 消息 发 布 模式 的 模板 ， 相 
关 的 组 织 机 构 可 采用 或 据 此 工作 。 根 据 请 求 的 不 同 ， 是 否 能 容易 地 从 数据 库 和 记录 中 提取 信 
息 ， 以 及 是 否 服从 前 述 各 项 法 规 并 满足 其 最 后 期 限 要 求 等 ， 都 会 对 组 织 机 构 产 生 管 理 费 用 ， 
因此 许多 单位 选择 固化 策略 和 流程 ， 并 与 受过 培训 的 员工 一 起 组 成 其 治理 结构 的 一 部 分 。 这 
经 常 是 由 一 个 主要 负责 法 律 和 管理 信息 或 数据 的 部 门 或 个 人 来 处 理 ， 也 可 能 是 处 理 DPA 的 
部 门 。 对 于 那些 响应 请 求 可 能 要 求 高 额 行政 费用 的 地 方 ， 可 能 要 考虑 是 否 向 请 求 者 收费 。 然 
而 ， 也 有 许多 组 织 为 了 减少 遵从 FOIA 或 FOISA 所 带 来 的 管理 工作 和 费用 ， 而 在 它们 的 策 
略 流程 中 确定 ， 定 期 自发 地 公布 那些 非 蓓 免 信 息 ， 大 部 分 是 在 公众 和 内 部 人 员 均 可 访问 的 
Web 网 站 上 。 此 外 ， 在 决策 结构 、 信 息 和 数据 管理 策略 中 还 考虑 到 跨 组 织 记录 、 存 储 和 管理 
数据 的 相关 问题 ， 这 样 做 时 要 特别 注意 能 以 相对 低 的 代价 立即 访问 到 数据 ， 从 而 满足 信息 官 
给 出 的 最 终 期 限 要 求 。 


21.2.7 ”国际 银行 业 一 一 巴塞 尔 儿 协议 


关于 资本 计量 和 资本 标准 的 国际 趋同 (The International Convergence of Capital Measurement 
and Capital Standards), EPRA “BÆRI”, Æ 2004 年 对 由 巴塞 尔 银行 监管 委员 会 (BCBS) 
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推出 的 1998 巴塞 尔 资 本 协议 (巴塞 尔 工 ) 的 修订 版 。 其 中 含 一 些 建议 的 政策 ， 要 求 各 国 必 
须 将 其 纳入 法 律 ， 并 由 合适 的 国家 监管 机 构 监 管 。 在 美国 ， 这 个 监管 机 构 是 由 美国 十 家 最 大 
的 国际 活跃 银行 构成 的 联邦 储备 银行 和 证 券 公 司 证 券 交 易 委 员 会 。 创 建 这 两 家 监管 机 制 是 为 
了 使 全 球 竞 争 性 机 构 处 于 同一 平台 ， 并 设置 标准 以 减 小 世界 金融 系统 内 的 系统 性 风险 。 国 际 
银行 系统 内 的 机 构 通 过 知 干 种 方式 相互 联系 ,包括 契约 (agreements)、 借 款 (loans) 和 其 他 
信贷 义务 责任 (credit and debt obligations)。 令 人 担忧 的 是 ， 一 个 大 公司 倒台 可 能 造成 远离 
它 的 国家 和 组 织 机 构 拖 欠 债 务 。 
巴塞 尔 卫 框架 有 三 块 主要 的 基石 : 
(1) 最 小 化 资本 需求 。 机 构 必 须 保持 足够 的 资金 (储备 ) 以 应 对 他 们 资产 组 合 (借款 、 
有 价 证 券 等 ) 的 固有 风险 水 平 。 修 订 并 扩充 了 风险 计量 ,包括 : 
Ca) 信贷 风险 一 一 债权 人 不 能 收回 他 的 借款 的 风险 (本 金 和 利息 )。 
(b) 市 场 风险 一 一 当 市 场 (或 经 济 ) 衰退 时 ， 所 有 投资 回报 都 将 衰退 的 风险 ， 原 因 
可 能 是 工业 界 ， 也 可 能 是 公司 特殊 的 原因 ， 包 括 利率 和 现金 短缺 。 
(e) 利率 风险 一 一 当 利 率 增加 时 投资 价值 减 小 的 风险 。 
(d) 操作 风险 由 于 内 部 控制 混乱 、 操 作 不 当 、 系 统 和 人 力 资源 等 原因 造成 损失 
的 风险 ， 以 及 某 些 外 部 事件 (如 自然 灾害 ) 造成 损失 的 风险 。 
(2) 监督 审查 程序 。 管 理 层 必须 掌握 和 实际 控制 风险 ， 有 足够 的 内 部 风险 控制 和 定期 报 
告 ， 包 括 补 偿 计 划 ， 用 于 奖励 适当 的 风险 管理 行为 。 

(3) 市 场 纪律 。 机 构 必 须 癌 大 众 公 开 它 的 资金 充足 率 、 风 险 承 担 以 及 估算 和 迁移 风险 的 

程序 。 

为 了 计算 市 场 风 险 ， 公 司 必须 汇集 正 交 易 借 贷 〈 信 用 卡 、 车 、 房 和 商业 等 )， 以 及 至 少 
每 日 的 金融 操作 和 实时 的 贸易 情况 。 风 险 计 算 还 需要 每 一 资产 一 到 两 年 甚至 更 长 的 历史 数 
据 ， 以 便 能 计算 风险 模型 ， 包 括 蒙 特 卡 洛 模拟 中 要 求 的 方差 - 协 方差 矩阵 。 信 和 贷 风 险 模 型 用 
到 一 些 外 部 资源 ， 比 如 标准 普尔 公司 (Standard & Poor) 对 上 市 公司 和 高 流通 性 金融 产品 的 
信用 排名 ， 但 银行 还 必须 维护 足够 的 数据 以 使 得 其 内 部 风险 模型 生效 。 这 包括 信贷 历史 、 商 
业 财 务 数据 、 贷 款 员 报表 ， 等 等 。 评 估 操 作风 险要 求 更 多 数据 ,巴塞 尔 卫 要 求 至 少 5 年 的 数 
据 。 操 作风 险 评估 要 求 分 析 高 频 低 值 的 事件 ， 更 关键 的 是 高 值 罕 见 的 事件 ， 因 为 在 考虑 基础 
的 资金 需求 时 ， 这 些 事件 没什么 统计 意义 。 在 美国 和 欧洲 正在 形成 的 大 财团 共享 操作 风险 事 
件 ， 使 得 每 个 成 员 都 先 有 一 个 基础 ， 在 其 上 再 开发 他 们 自己 内 部 的 操作 风险 模型 。 与 使 用 萨 
班 斯 - 奥克斯 利 法 规 一 样 ， 适 当地 进行 有 效 的 内 部 控制 在 减轻 操作 风险 方面 能 起 很 大 作用 。 

2008 年 9 月 金融 风暴 之 后 ，BCBS 重点 修改 了 原 有 的 资金 充足 率 指南 ， 产 生 了 巴塞 尔 亚 。 
目标 是 加 强 全 球 资金 和 流动 准则 ， 以 增进 银行 部 门 的 适应 性 。 在 2010 年 11 月 的 首尔 峰会 上 ， 
G20 (20 大 经 济 体 的 财政 部 长 和 中 央 银 行 行 长 ) 支持 巴塞 尔 亚 。 目 前 ， 巴 塞 尔 亚 并 不 是 所 有 细 
节 都 已 确定 下 来 ， 但 核心 原则 已 达成 一 致 ， 并 责成 相关 机 构 于 2019 年 之 前 全 面 完 成 。 与 巴塞 
尔 开 一 样 ， 金 融 机 构 持 有 和 交换 的 数据 及 元 数据 的 质量 将 是 实现 巴塞 尔 亚 最 重要 的 因素 。 


21.3 ”建立 守法 、 道 德 的 数据 管理 文化 


前 一 节 讨 论 的 近年 来 颁布 的 法 规 ， 其 复杂 性 及 与 IT 的 牵连 引发 出 若干 问题 ， 它 们 对 一 
个 组 织 机 构 上 上 下 下 的 员工 都 极其 重要 。 高 层 管理 人 员 ， 如 董事 会 成 员 、 总 裁 、 首 席 信息 官 
(CIO》 和 数据 管理 员 们 发 现 ， 他 们 防范 员工 违背 这 些 法 规 的 责任 变 得 越 来 越 午 。 因 此 ， 需 要 
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强制 制定 相关 的 政策 并 明确 传达 到 各 级 组 织 。 一 个 明显 的 问题 来 了 : “从 哪儿 开始 ?” 下 面 给 
出 基本 步骤 。 


21.3.1 制定 本 组 织 内 关于 法 律 和 道德 行为 的 政策 


首先 ， 高 层 管理 团队 了 解 新 的 法 规 和 工业 界 的 变化 非常 重要 。 评 佑 这 些 变化 对 本 组 织 的 
影响 是 关键 的 第 一 步 。 业 务 全 球 一 体 化 常常 带 来 问题 ， 例 如 ， 一 个 公司 发 现 ， 它 在 在 茶 个 法 
律 匣 刻 的 国家 有 业务 ， 则 为 了 满足 这 个 国家 的 要 求 ， 它 不 得 不 按 最 严 的 标准 调整 全 部 操作 。 

接 下 来 ， 数 据 管 理 员 和 首席 信息 官 需要 评估 法 规 对 组 织 机 构 内 数据 的 流动 有 什么 影响 。 
特别 应 该 注意 来 自 自治 机 构 内 部 和 外 部 的 用 户 是 如 何 收集 、 存 储 、 保 密 和 访问 数据 的 。 第 
20 章 讨论 过 的 许多 安全 技术 可 用 于 此 。 接 着 ,各 种 新 的 或 修改 过 的 操作 流程 应 形成 文档 ， 
并 通知 所 有 相关 人 员 。 此 外 ,评估 有 可 能 发 现 另 外 一 些 员工 和 合作 伙伴 ， 他 们 在 工作 中 会 接 
触 到 敏感 数据 和 程序 ， 这 在 以 前 曾 被 忽视 了 。 

一 旦 指导 业务 合法 进行 的 守则 明确 下 来 ， 类 似 的 关于 如 何 有 道德 地 开展 业务 的 规则 也 应 
该 形成 。 组 织 机 构 大 多 都 有 企业 道德 声明 ， 可 以 以 此 为 起 点 。 正 像 曾 强调 过 的 那样 ， 出 台 的 
政策 都 必须 形成 文档 ， 通 告 所 有 雇员 并 让 其 认识 到 高 层 在 考虑 这 些 问题 时 的 严肃 性 。 

最 后 ， 对 于 违反 法 律 和 道德 的 行为 ， 应 该 公平 、 迅 速 地 按照 所 有 员工 都 周知 的 条 例 加 以 
处 理 。 这 样 也 有 助 于 政策 和 程序 进一步 发 展 完善 ， 使 法 律 和 道德 法 规 不 断 演化 以 适应 新 的 商 
业 形 势 。 

关于 通用 指导 原则 ， 还 可 借鉴 IT 相关 的 职业 社团 和 组 织 已 经 采用 的 道德 守则 、 行 为 守 
则 和 行业 准则 。 下 一 节 讨 论 两 个 这 样 的 守则 文本 。 


21.3.2 行业 组 织 和 伦理 守则 


许多 行业 组 织 都 有 道德 守则 ， 其 成 员 都 必须 承诺 遵守 。 也 许 最 全 面 的 IT 道德 守则 是 美 
国 计 算 机 协会 (ACM) 制定 的 ， 该 组 织 自 1947 年 成 立 ， 至 今 在 全 世界 已 有 八 万 会 员 ( www. 
acm.org)。ACM 的 道德 和 职业 行为 守则 (ACM，1992 ) 含 24 条 个 人 责任 声明 ， 分 为 四 个 主 
要 类 别 : 
e 基本 道德 考量 。 该 类 别 述 及 下 面 八 个 方面 : 
对 社会 和 人 类 福 社 的 贡献 。 
避免 伤害 他 人 。 
诚实 守信 。 
公正 ， 无 歧视 行为 。 
重视 产权 ， 包 括 版 权 和 专利 。 
给 予 知 识 产权 合适 的 信任 。 
尊重 他 人 隐私 。 
重视 机 密 性 。 
e 特殊 职业 行为 考量 。 该 类 别 述 及 下 面 八 个 方面 : 
无 论 是 过 程 还 是 产品 ， 在 业务 工作 中 努力 追求 最 高 的 质量 、 效 力 和 尊严 。 
获取 并 保持 职业 能 力 。 
了 解 并 遵守 适用 于 职业 工作 的 已 有 法 律 。 
接受 并 提供 适当 的 职业 检查 。 
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m 对 计算 机 系统 及 其 影响 进行 全 面 彻底 的 评 佑 ， 包 括 对 可 能 出 现 的 风险 的 分 析 。 
e 重视 合同 、 约 定 和 担负 的 责任 。 
a 提高 公众 对 计算 及 其 结果 的 理解 。 
m 仅 当 被 授权 时 才 访 问 计 算 和 通信 资源 。 
© 作为 领导 的 考量 。 该 类 别 述 及 下 面 六 个 方面 : 
m 能 对 组 织 单位 内 的 成 员 清晰 地 表达 社会 责任 ， 并 鼓励 全 盘 接受 这 些 责任 。 
@ 管理 人 员 和 资源 ， 他 们 正 设计 和 构建 能 改善 工作 质量 的 信息 系统 。 
m 承认 并 支持 对 机 构 内 计算 和 通信 资源 的 恰当 和 授权 使 用 。 
a 保证 一 个 系统 的 用 户 或 将 受 该 系统 影响 的 人 ， 在 需要 评定 和 确认 阶段 能 清楚 地 表 
达 他 们 的 需求 ， 以 后 ， 该 系统 必须 确认 满足 了 这 些 需 求 。 
e 明确 表述 并 支持 这 样 一 些 政策 ， 它 们 保护 一 个 计算 机 系统 的 用 户 和 受 系统 影响 的 
人 的 尊严 。 
e 创造 机 会 ， 让 组 织 机 构 内 的 成 员 能 学 习 和 了 解 计算 机 系统 的 原理 和 局 限 。 
e 遵守 守则 。 最 后 一 类 述 及 两 个 主要 方面 : 
m 坚持 和 推广 本 守则 的 各 项 原则 。 
m 违反 本 守则 视 同 不 满足 ACM 会 员 资 格 。 
英国 计算 机 协会 (www.bes.org) 成 立 于 1957 年 ， 目 前 有 来 自 100 个 国家 的 5 万 多 会 员 。 
所 有 BCS 会 员 同 意 遵守 的 BCS 行为 守则 2011 (BCS, 2011) 指出 了 四 个 方面 的 行为 : 
(1) 公众 利益 
(a) 你 应 该 适当 地 考虑 公众 的 健康 、 隐 私 、 安 全 和 他 人 及 环境 的 福 社 。 
(b) 你 应 该 适当 地 考虑 第 三 方 的 权益 。 
Cc) 你 进行 职业 活动 时 ， 不 应 该 歧视 性 别 、 性 取向 、 婚 姻 状 况 、 国 籍 、 肤 色 、 人 种 、 血 
统 、 宗 教 、 年 龄 、 残 疾 ， 或 任何 别 的 情况 和 要 求 。 
(d) 你 应 该 提倡 平等 地 获取 IT 的 好 处 ， 并 且 一 旦 有 机 会 就 试图 惠及 社会 的 方方面面 。 
( 2 ) 专业 能 力 与 诚实 正直 
(a) 你 应 该 仅 承担 你 专业 能 力 能 及 的 工作 或 提供 力所能及 的 服务 。 
(b) 你 不 应 该 声称 具有 你 没有 的 能 力 。 
Cc) 你 应 该 不 断 地 提高 业务 知识 、 技 能 和 能 力 ， 持 续 关 注 与 你 的 领域 相关 的 技术 的 发 
展 、 过 程 和 标准 。 
(d) 你 应 该 保证 自己 有 法 律 知识 ,理解 法规， 并 能 在 履行 你 的 职业 责任 时 遵守 法 规 。 
(e) 你 应 该 尊重 和 重视 不 同 的 观点 ， 并 征求 、 接 受 和 欢迎 对 工作 坦诚 的 批评 意见 。 
(f) 你 应 该 避免 伤害 他 人 ， 包 括 他 们 的 财产 、 声 誉 或 就 业 ， 无 论 是 通过 错误 、 恶 意 的 行 
为 ， 还 是 因为 粗心 大 意 的 行为 。 
(g) 你 应 该 拒绝 任何 行贿 受贿 或 违反 职业 道德 的 诱惑 。 
(3) 有 关 当 局 的 职责 
(a) 你 应 该 按照 相关 当局 的 要 求 ， 小 心 、 勤 勉 地 履行 你 的 职责 ， 并 在 所 有 时 候 都 行使 你 
的 职业 判断 力 。 
(b) 任何 情形 下 你 都 应 该 避免 引起 与 相关 当局 之 间 的 利益 冲突 。 
(c) 你 应 该 为 自己 和 下 属 的 工作 承担 职责 。 
(d) 你 不 应 该 披露 或 授权 披露 ， 不 为 谋私 利 或 为 第 三 方 谋 利 而 使 用 机 密 信息 ， 除 非 你 的 
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相关 当局 人 允许， 或 法 律 要 求 这 样 。 
(e) 在 产品 、 系 统 或 服务 的 展示 中 ， 你 应 该 不 会 错误 表达 或 故意 保留 信息 【除非 受 保密 
的 限制 而 不 能 披露 这 个 信息 )， 或 者 利用 别人 的 知识 或 经 验 缺 失 。 
(4) 行业 职责 

《a) 你 应 该 认同 你 有 责任 维护 行业 的 声誉 ， 不 做 任何 有 损 行业 名 誉 的 事情 。 

(b) 你 应 该 通过 参与 开发 、 使 用 和 强制 执行 等 途径 ， 试 图 完善 行业 标准 。 

(c) 你 应 该 维护 BCS (英国 特许 IT 协会 ) 的 声誉 和 良好 形象 。 

(d) 你 应 该 带 着 诚意 和 尊敬 与 合作 伙伴 共事 ， 与 BCS 会 员 共 事 ， 与 其 他 同行 共事 。 

Ce) 如 果 你 发 现 违 法 犯罪 ， 或 面临 破产 ， 或 没 资格 担任 公司 董事 等 状况 时 ， 你 应 该 通知 

BCS， 并 给 出 判断 每 种 情况 的 相关 细节 。 

(£) 你 应 该 鼓励 和 文 持 同 伴 的 职业 成 长 。 

无 论 是 ACM 守则 还 是 BCS 守则 ， 首 先 都 是 建立 为 社会 提供 益处 这 个 基础 。 以 此 为 出 
发 点 ， 都 认为 按 最 高 标准 执行 自己 的 职责 ， 并 守法 、 符 合 道德 地 行使 职责 是 最 重要 的 。 承 
认 知 识 产 权 (下 面 讨论 )、 致 谢 来 源 、 尊 重 隐私 和 机 密 性 、 全 面 关 心 公 众 健康 、 安 全 和 环境 
等 也 都 是 公共 主题 。 正 如 本 章 所 述 ， 两 部 守则 都 明显 地 提 到 会 员 有 责任 了 解 并 遵守 所 有 相关 
. 的 法 律 、 法 规 和 标准 。 两 部 守则 也 提 到 各 级 领导 的 责任 和 对 一 般 大 众 的 责任 。 美 、 英 两 国 的 
主要 的 计算 机 协会 能 够 共享 许多 共识 ， 是 因为 他 们 语言 相同 ， 对 法 律 、 道 德 本 有 广泛 共识 ， 
这 一 点 不 足 为 奇 。 然 而 ， 并 不 是 所 有 的 国家 跟 美 、 英 都 有 相同 的 社会 价值 观 。 因 此 ， 我 们 
能 在 几 个 国家 发 现 这 样 的 情形 一 一 个 人 隐私 权 和 反 歧 视 的 概念 都 与 美 、 英 的 说 法 不 一 致 。 

已 有 的 这 些 守 则 和 由 Lee (2006) 引用 的 其 他 一 些 守 则 都 可 用 作 资 源 ， 供 希望 建立 自己 
的 类 似 准 则 的 组 织 机 构 参 考 。 


21.3.3 制定 DreamHome 组 织 内 部 关于 法 律 和 道德 行为 的 政策 


本 节 我 们 给 出 DreamHome 房屋 租赁 公司 如 何 制定 关于 法 律 和 道德 行为 的 内 部 政策 。 作 
为 一 个 业务 公司 ，DreamHome 每 天 要 打交道 的 对 象 包括 私人 和 集体 业主 、 和 希望 或 者 已 经 租 
了 房子 的 客户 ， 以 及 报 业 公司 等 其 他 组 织 机 构 。DreamHome 保存 的 数据 可 视 为 敏感 信息 ， 
如 一 个 客户 为 租 某 处 房屋 所 付 的 租金 额 。 类 似 地 ， 客 户 的 租房 历史 和 支付 信息 也 都 是 非常 敏 
感 的 。 因 此 ，DreamHome 的 政策 应 明确 阐述 : 
e DreamHome 员工 与 客户 和 业务 伙伴 (如 业主 ) 之 间 的 交互 5 关键 点 包括 : 
a 导 敬 客户 (比如 ， 在 电子 邮件 中 或 电话 上 )。 
m Ra IKE. 
mH) Be Hil FE a ERAR a SAKE, FLFR ARER o 
© 为 客户 和 其 他 业务 数据 保密 。 关 键 点 包括 : 
m 提高 对 客户 个 人 数据 敏感 性 的 认识 ， 包 插 支 付 历史 、 信 用 卡号 和 租房 历史 等 。 
m 为 保护 这 些 敏 感 数 据 ， 确 保 进 行 恰 当 的 安全 测量 。 
m 各 种 正规 的 处 理 程序 ， 用 于 来 自 各 方面 的 数据 请 求 : 
o 内 部 员工 (比如 ， 建 议 挖 掘 数据 或 访问 敏感 客户 数据 )。 
o 业主 (比如 ,请求 重 设 密码 )。 
o 业务 伙伴 (如 果 允 许 这 样 的 数据 共享 )。 
o 其 他 可 能 的 法 律 执行 (比如 ， 请 求 查 询 某 客户 的 支付 信息 和 租房 历史 )。 
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© 公司 资源 使 用 (硬件 、 软 件 、Internet 等 )。 关 键 点 包括 : 
8 没有 分 公司 经 理 的 许可 ,计算机 硬件 不 可 以 移动 。 
m 种 许可 证 (licensed) 的 计算 机 软件 不 可 以 复制 、 散 发 或 不 合适 地 用 作 他 用 。 
m 没有 IT 部 门 的 批准 不 可 以 安装 其 他 软件 。 
m Internet 资源 不 可 以 用 于 非 公 司 的 事情 。 
© 损害 客户 和 业务 伙伴 数据 的 安全 性 或 信任 的 后 果 。 关 键 点 包括 : 
e 将 所 有 违规 行为 写成 报告 提交 监督 委员 会 ， 该 委员 会 由 来 自 不 同业 务 部 门 和 管理 
层 的 代表 组 成 。 严 重 的 违规 还 将 上 报 有 关 当 局 。 
mo 故意 或 恶意 的 违规 将 被 开除 并 起 诉 。 
m 其 他 的 违规 将 根据 督 查 委员 会 判定 的 违规 严重 性 给 予 相 应 处 罚 。 
最 后 ，DreamHome 还 应 该 建立 一 个 程序 ， 每 年 定期 或 每 次 出 现 严重 违纪 事件 或 其 他 突 
发 情况 时 ， 评 审 一 下 该 政策 ， 以 确保 当 技 术 和 业务 环境 发 生变 化 时 该 政策 的 适用 性 。 


21.4 知识 产权 


最 后 一 节 ， 我 们 介绍 知识 产权 (intellectual property， 有 了 时 用 首 字 母 缩写 IP) 的 主要 概 
念 。 重 要 的 是 ， 数 据 与 数据 库 管理 员 、 业 务 分 析 师 和 软件 开发 员 都 认识 并 理解 围绕 IP 的 相 
关 问 题 ， 保 护 他 们 自己 的 思想 ， 同 时 不 侵害 别人 的 权益 。 我 们 从 定义 开始 。 


| 知识 产权 | 人 类 在 产业 界 、 科 学 、 文 学 和 艺术 领域 的 创造 的 产物 。 


知识 产权 包括 由 个 人 或 团体 想 出 来 、 开 发 出 来 或 写 出 来 的 发 明 、 原 创 思想 、 专 利和 专利 
申请 、 发 现 、 间 新 、( 注 册 ) 商标 、 设 计 和 设计 权 (注册 和 未 注册 )、 作 品 (包括 计算 机 软件 ) 
和 专 有 技术 。 工 作 过 程 中 产生 的 IP 法律 上 属于 雇主 ， 除 非 有 特别 的 允诺 。 正 像 有 形 产品 的 
所 有 权 赋 了 予 所 有 者 各 种 权利 一 样 ， 无 形 资产 的 所 有 权 也 试图 为 所 有 者 提供 类 似 的 专 有 权利 ， 
即 能 赠与 、 发 放 许可 证 和 转让 他 们 的 知识 产权 。 虽 然 知 识 产 权 的 排他 性 似乎 很 强 , (B IP 2S 
的 强势 常常 由 于 时 空 的 限制 或 所 有 者 自己 放弃 维权 而 削弱 。 


我 们 区 分 两 类 IP: 
背景 IP 一 个 活动 发 生 之 前 已 存在 的 IP 
前 景 IP 一 个 活动 中 产生 的 IP 


一 个 项 目 可 能 用 到 不 属于 本 组 织 的 背景 IP， 这 时 应 该 与 IP 所 有 者 达成 契约 。 保 护 IP 权 
利 有 三 种 主要 的 方式 : 专利 、 版 权 和 注册 商标 ， 下 面 进行 讨论 。 


21.4.1 专利 


专利 | 提供 一 种 专 有 (SK) 的 权利 ， 即 在 设 定 的 一 段 时 间 内 有 权 加 工 (make)、 使 用 
(use)、 销 售 (sell) 或 进口 (import) 一 项 发 明 。 


在 个 人 或 机 构 申 请 时 能 说 明 下 列 事项 ， 政 府 即 授予 其 专利 : 
e 此 发 明定 新 的 。 

© 此 发 明 以 茶 种 方式 显示 其 有 用 。 

e 此 发 明 表 现 出 创造 力 。 
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此 外 ， 专 利 系 统 中 一 个 关键 考量 是 专利 申请 中 必须 说 清楚 此 发 明 如 何 工 作 。 这 样 ， 此 
专利 一 旦 公布 ， 公 众 即 可 获得 这 方面 的 信息 ， 增 长 了 公共 知识 财富 。 专 利 有 效 地 保护 了 新 技 
术 ， 使 得 一 项 产品 、 一 部 作品 或 一 个 程序 能 获得 长 期 的 商业 效益 。 然 而 ， 值 得 注意 的 是 艺术 
创作 、 数 学 模型 、 计 划 、 模 式 或 其 他 纯 心智 的 过 程 不 能 申请 专利 。 


21.4.2 版权 


版 权 | 提供 一 种 专 有 (合法 ) 的 权利 ， 即 在 设 定 的 一 段 时 间 内 有 权 复 制 和 分 发 一 部 文学 著 
作 、 一 段 音乐 、 一 部 视听 作品 或 任 一 有 作者 的 作品 。 


专利 有 正式 的 申请 程序 ， 但 版 权 不 同 ， 作 品 一 旦 成 型 (例如 ， 写 出 来 或 有 声音 ) 版 权 便 
立即 有 效 。 版 权 不 仅 覆 盖 图 书 、 文 章 、 歌 词 、 音 乐 CD 、 视 频 、DVD 和 电视 节目 ， 也 包括 计 
算 机 软件 、 数 据 库 、 技 术 图 纸 与 设计 以 及 多 媒体 。 版 权 持 有 者 可 出 卖 其 对 作品 的 权利 以 换取 
经 济 利益 ， 这 通常 称 为 版 税 (royalties)。 版 权 也 有 例外 ， 某 些 轻 量 级 的 使 用 可 以 不 损害 版 权 
(例如 ， 非 商业 受 限 使 用 ,私人 学 习 和 教学 用 )。 

版 权 也 给 出 道义 上 的 权利 ， 即 标识 谁 是 作品 发 明 人 ， 反 对 牌 曲 和 损毁 名 誉 。 虽 然 版 权 不 
要 求 注册 ， 但 许多 国家 允许 对 作品 进行 注册 ， 比 如 通过 确定 作品 的 标题 ， 或 提供 当 出 现 版 权 
纠纷 时 法 庭 可 用 的 明显 证 据 ， 等 等 。 


21.4.3 (注册 ) 商标 


商标 | 提供 一 种 专 有 (合法 ) 使 用 权 ， 即 有 权 使 用 标识 某 货 物 或 服务 发 源 的 文字 、 符 号 、 图 
像 、 声 音 或 其 他 某 种 有 区 分 度 的 元 素 。 


第 三 种 形式 的 保护 是 商标 。 通 常 ， 商 标 与 具体 的 货物 和 服务 相关 联 ， 以 帮助 顾客 识别 他 
们 所 购买 物品 的 类 型 和 质量 。 与 专利 和 版 权 一 样 ， 商 标 也 赋予 其 所 有 人 权利 ， 能 排他 合法 地 
使 用 、 发 放 许 可 证 和 买卖 被 该 商标 注册 的 货物 和 服务 。 与 版 权 一 样 ， 商 标 不 一 定 注册 ， 不 过 
注册 它 可 能 更 明智 一 些 ， 即 使 在 通常 法 律 下 这 样 做 昂贵 且 耗 时 。 考 虑 DreamHome 房屋 租赁 
的 案例 研究 ， 那 家 公司 可 能 决定 注册 公司 的 名 字 。 


21.4.4 ”软件 的 知识 产权 问题 


正如 前 面 所 说 ， 有 若干 理由 表明 理解 知识 产权 很 重要 

。 作为 原创 思想 和 工作 成 果 的 生产 者 ， 清 楚 你 或 你 的 组 织 拥有 的 权利 。 

。 认识 原创 工作 成 果 的 价值 。 

。 清楚 保护 和 开发 利用 这 一 工作 成 果 的 程序 。 

。 懂得 如 何 进行 法 律 度量 ， 以 防 对 工作 成 果 的 非法 使 用 。 

。 公平 、 明 智 地 确定 你 的 工作 成 果 可 合法 用 于 非 一 利 目的 。 

本 节 我 们 简要 讨论 某 些 与 软件 知识 产权 特别 相关 的 问题 。 
软件 与 专利 性 

20 世纪 70 年 代 到 80 年 代 ， 关 于 专利 和 版 权 是 否 应 该 保护 计算 机 软件 曾 有 过 广泛 的 讨 
论 。 当 时 普遍 接受 的 意见 是 ， 软 件 应 受 版 权 保护 ， 而 使 用 软件 的 设备 应 受 专利 保护 。 然 
而 ， 时 至 今日 界限 已 不 清晰 。 虽 然 英国 仍 把 软件 排除 在 专利 之 外 ， 但 还 是 有 -一些 地 方 认为 
软件 是 整个 机 械 或 工业 过 程 的 一 部 分 。 因 此 ， 仅 为 一 段 软件 申请 专利 行 不 通 ， 但 为 一 段 软件 
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产生 的 技术 效果 申请 专利 则 将 了 予以 考虑 ， 这 符合 21.3.1 节 提 出 的 要 求 。 在 美国 ， 专 利 性 扩展 
为 包括 所 谓 的 “业务 方法 ”( business method)， 所 以 许多 软件 已 授 专利 ， 更 多 的 还 在 申请 过 
程 中 ， 随 着 Internet、 移 动 操 作 系 统 、 应 用 和 电子 商务 莲 勃 发 展 ， 这 一 现象 尤为 突显 。 
近年 出 现 的 智能 手机 和 平板 电脑 开辟 了 一 块 新 发 明 的 竞技 场 ， 为 争夺 操作 系统 和 需 件 的 
控制 权 ， 引 发 如 谷歌 、 人 苹果、 三星、 微软、 摩托 罗拉 和 HTC 等 多 家 跨国 大 公司 展开 围绕 其 
专利 的 激烈 竞争 。 其 中 有 些 争端 和 申述 颇具 争议 性 ， 因 为 ， 除 了 “保护 发 明 ” 这 个 笃 而 星之 
的 理由 外 ， 解 决 争端 还 不 可 避免 地 要 上 法 庭 ， 这 样 就 可 以 阻止 或 拖延 一 种 设备 在 某 地 区 的 销 
售 ， 从 而 减少 其 市 场 占有 率 。 这 仅仅 是 一 个 例子 ， 说 明 当 人 们 考虑 知识 产权 时 ， 为 了 使 一 个 
机 构 的 行为 合法 且 符 合 道德 观念 上 的 变化 ， 法 律 所 面临 的 新 的 挑战 。 
软件 和 版 权 
所 有 软件 都 会 有 一 名 或 多 名 作者 ， 他 们 对 目 己 所 写 的 东西 拥有 知识 产权 。 因 此 ， 无 论 你 
是 否 为 版 权 付 过 费 ， 它 都 适用 于 所 有 软件 ， 并 且 分 发 和 使 用 软件 要 按照 许可 证 给 出 的 条 款 进 
行 。 一 款 软 件 适 用 的 条 件 与 若干 因素 有 关 ， 但 一 般 有 四 类 许可 证 ; 
© 商用 软件 (永久 使 用 )。 在 这 种 情况 下 ， 软 件 要 付费 ， 而 许可 证 允许 你 永久 使 用 (一 
般 仅 限 一 台 机 器 )， 只 有 以 防 机 需 出 错时 才 备 份 软件 。 软 件 可 转移 到 另 一 台 机 需 上 ， 
但 必须 从 原来 的 机 器 上 删除 掉 。 某 些 情况 下 ， 许 可 证 也 允许 在 多 台 机 器 上 使 用 软件 ， 
但 这 须 在 许可 证 条 款 上 明确 说 明 。 
© 商用 软件 (年 费 制 )。 这 与 永久 使 用 许可 证 类 似 ， 只 是 可 能 要 求 在 连续 使 用 的 每 一 年 
里 都 付费 。 大 多 数 情况 下 若 不 缴费 ， 软 件 就 停止 工作 ， 续 费 后 提供 商会 发 放 一 个 新 
的 许可 证 关键 字 以 重启 工作 。 年 租 这 种 方式 常用 于 站 点 许可 证 (一 旦 付费 ， 组 织 机 构 
想 在 多 少 台 机 器 上 使 用 软件 就 在 多 少 台 机 器 上 用 ) 和 大 型 机 与 服务 器 上 的 软件 许可 。 
同样 ， 许 可 证 条 款 上 要 明确 说 明 人 允许 的 使 用 方式 。 
共享 件 。 软 件 一 开始 有 一 个 免费 的 试用 期 ， 试 用 期 (例如 30 天 ) 一 过 ， 铬 还 想 继续 
使 用 该 软件 ， 则 要 求 向 软件 作者 交 费 (通常 很 少 )。 在 某 些 情况 下 ， 软 件 会 通过 拒绝 
工作 来 强制 用 户 交 费 。 夺 不管 它 ， 在 试用 期 后 继续 使 用 软件 ， 则 会 不 断 接 到 许可 证 
条 款 通知 并 且 已 经 开始 侵犯 作者 版 权 。 而 付费 后 ， 一 般 会 得 到 一 个 更 新 版 本 的 软件 ， 
它 不 会 再 不 断 提 醒 用 户 注 册 并 为 软件 付费 了 。 
自由 件 。 软 件 对 某 类 使 用 (例如 教育 和 个 人 使 用 ) 免费 。 主 要 有 了 两 类 目 由 件 : 分 发 
时 不 带 源 代码 以 防 用 户 修 改 的 软件 和 开放 源码 软件 ( OSS)。 后 者 通常 带 着 一 个 像 通 
用 公共 许可 证 (the GNU Public License, GPL) 一 类 的 许可 证 ,该 许可 证 说 明了 免费 
使 用 的 期 限 和 条 件 。 主 要 的 限制 是 软件 不 能 用 于 商业 目的 ， 虽然 通 常 允许 修改 软件 ， 
但 有 义务 把 所 做 的 改进 反馈 给 软件 原作 者 ， 以 便 在 后 续 发 布 的 版 本 中 体现 出 来 。 第 
二 条 限制 是 再 分 发 时 ， 要 把 版 权 化 的 GPL 许可 证 正文 加 进去 。 
注意 ， 前 两 种 情况 的 任 一 种 都 不 允许 修改 软件 ， 或 对 软件 进行 逆向 工程 ， 或 移 除 版 权 信 
息 和 类 似 内 容 。 所 有 软件 都 有 许可 条 件 ， 即 使 是 从 Internet 上 免费 下 载 的 ， 不 遵守 许可 条 件 
就 是 侵害 版 权 。 


21.4.5 ”数据 的 知识 产权 问题 


组 织 机 构 收集 、 处 理 以 及 可 能 与 贸易 伙伴 共享 的 数据 也 必须 加 以 考虑 。 数据 管理 员 一 定 
要 与 高 层 管理 和 法 律 顾 问 一 道 制定 政策 ， 强 制 何 时 共享 数据 ， 以 及 在 机 构 内 怎样 使 用 数据 。 
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例如 ， 考 虑 DreamHome 保存 的 关于 客户 租房 习惯 的 数据 。 其 他 零售 商 、 目 标 营销 公司 甚至 
法 律 执行 机 构 都 完全 可 能 有 兴趣 访问 客户 租房 的 详细 历史 信息 。 对 某 些 行业 ， 共 享受 限 的 数 
H (例如 不 骏 露 个 人 身份 的 购买 模式 ) 或 汇总 数据 从 增收 的 立场 可 能 还 说 得 过 去 。 如 果 某 个 
业务 最 适宜 共享 数据 ， 那 必须 实行 数据 许可 证 ， 以 防 数据 再 共享 给 其 他 方 。 

虽然 这 不 完全 是 个 云 计 算 问 题 ， 但 随 着 云 计算 应 用 的 拓展 和 数据 的 跨国 存储 ， 能 否 完 
全 控制 对 个 人 和 团体 IP 的 访问 日 益 受 到 关注 。 例 如 ， 某 些 政府 立法 规定 他 们 可 以 不 受 限 制 
地 访问 团体 和 个 人 的 私有 数据 。 作 为 对 911 AT BE, SS APE SE 2001 强 
迫 那 些 有 本 地 和 国外 服务 器 的 美国 公司 或 控制 有 数据 的 美国 公司 释放 关于 个 人 的 数据 一 一 哪 
怕 他 们 当地 (例如 欧洲 ) 的 法 律 禁止 这 样 做 。 由 于 美国 公司 以 及 它们 在 欧洲 的 子 公司 都 受 美 
国 爱国 者 法 案 制 约 ， 所 以 凡 使 用 其 服务 的 欧洲 顾客 都 把 自己 暴露 了 给 美国 法 律 。 为 避免 此 情 
况 ， 专 门 建立 了 美 欧 瑞 士 安全 港口 框架 (The U.S. and EU Swiss Safe Harbour framework), 
然而 ， 据 来 自 运转 在 欧洲 的 某 些 美国 公司 的 报道 ， 已 确认 这 是 无 效 的 。 


本 章 小 结 

e 最 近 众 所 周知 的 一 些 机 构 的 破产 迫使 人 们 仔细 审视 它们 ， 结 果 导 致 在 美国 和 其 他 地 方 出 台 了 若干 新 
的 法 律 和 规章 。 

符合 道德 被 定义 为 在 给 定 的 社会 和 文化 中 “做 对 的 事情 ”。 

IT 治理 用 于 指明 决策 权 和 责任 ， 以 鼓励 在 使 用 IT 时 能 有 期 望 的 行为 。 

合法 的 行为 常常 与 符合 道德 的 行为 连 在 一 起 ， 其 实 并 不 总 是 这 样 。 

本 章 讨论 的 大 多 数 法 律 都 关乎 怎样 有 助 于 减少 不 打算 暴露 的 信息 被 暴露 的 可 能 性 。 

本 章 讨论 的 大 部 分 法 令 法 规 中 的 核心 部 分 都 有 保护 客户 数据 的 内 容 ， 同 时 增加 了 公司 需 向 官方 机 构 
报告 的 要 求 。 这 两 方面 的 核心 都 是 数据 管理 问题 。 

内 部 控制 是 组 织 机 构 采 用 的 一 组 规则 ， 以 保证 本 单位 制定 的 政策 和 流程 不 被 违反 、 数 据 安 全 可 靠 且 
业务 运转 高 效 。 

在 组 织 内 (当然 在 IT 内 ) 建立 保密 、 隐 私 的 意识 ， 并 在 其 涉及 组 织 机 构 收 集 和 处 理 的 数据 时 进行 报 
告 是 一 个 关键 的 任务 ， 特 别 在 当今 这 样 一 个 变化 的 环境 下 。 

知识 产权 包括 由 个 人 或 团体 想 出 来 、 开 发 出 来 或 写 出 来 的 发 明 、 原 创 思想 、 专 利和 专利 申请 、 发 
现 、 革 新 、 商 标 、 设 计 和 设计 权 、 作 品 和 专 有 技术 。 

背景 知识 产权 是 一 个 活动 发 生 之 前 已 存在 的 IP。 

前 景 知识 产权 是 一 个 活动 中 产生 的 IP。 

专利 提供 一 种 专 有 (合法 ) 的 权利 ， 即 在 设 定 的 一 段 时 间 内 有 权 加 工 (make), H (use)、 销 售 
(sell) 或 进口 (import) 一 项 发 明 。 

版 权 提供 一 种 专 有 (合法 ) 的 权利 ， 即 在 设 定 的 一 段 时 间 内 有 权 复 制 和 分 发 一 部 文学 著作 、 一 段 音 
乐 、 一 部 视听 作品 或 任 一 有 作者 的 作品 。 

商标 提供 一 种 专 有 (合法 ) 使 用 权 ， 即 有 权 使 用 标识 某 货 物 或 服务 发 源 的 文字 、 符 号 、 图 像 、 声 音 
或 其 他 某 种 有 区 分 度 的 元 素 。 


思考 题 


21.1 根据 组 织 机 构 如 何 管理 业务 来 定义 “道德 规范 ”。 
21.2 描述 这 样 的 业务 场景 ， 其 中 个 人 或 公司 的 行为 被 认为 是 : 
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21.3 
21.4 
21.5 


21.6 
21.7 


21.8 


习题 
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(a) 非法 且 不 道德 的 

(b) 合法 但 不 道德 的 

(c) 非法 但 符合 道德 

说 明 一 个 坚持 “行业 规范 ”的 公司 怎么 发 现 它 自己 违法 了 。 

描述 IT 治理 的 重要 性 以 及 它 与 组 织 机 构 内 法 律 和 道德 实践 的 联系 。 

说 明 一 个 国际 化 公司 会 受到 外 国法 律 的 什么 影响 ?在 什么 情况 下 它 可 能 要 因 其 不 可 控 的 原因 而 
为 顾客 负责 ? 

说 明 一 个 国际 化 公司 在 数据 管理 上 的 法 律 风 险 。 

描述 在 一 个 组 织 机 构 内 部 或 外 部 的 个 人 或 实体 怎样 才能 有 权 访 问 该 机 构 的 数据 ， 进 而 影响 数据 
的 管理 方式 。 

描述 在 知识 产权 保护 和 促进 技术 创新 时 遇 到 的 法 律 方面 的 挑战 。 


21.9 假设 你 是 一 家 欧洲 大 制药 公司 的 数据 管理 员 ， 该 公司 在 欧洲 、 日 本 和 美国 市 场 都 有 很 大 投入 ， 


21.10 


21.11 


21.12 


21.13 


21.14 


21.15 


21.16 


29.17 
21.18 


在 数据 管理 上 你 不 得 不 关注 的 最 大 问题 是 什么 ? 


假设 你 刚 入 职 一 家 大 型 金融 服务 公司 ， 出 任 IT 负责 人 。 现 要 求 你 编制 一 部 IT 道德 守则 。 你 将 
采取 哪些 步骤 来 完成 此 任务 ? 你 将 参考 哪些 资源 ? 

访问 一 下 Peter Neumann 关于 ACM 通讯 中 “内 部 风险 (Inside Risk) ”文章 的 归档 (www.csl. 
sri.com/users/neumann/insiderisks.html)。 简 单 总 结 一 下 在 这 些 归档 中 近来 涉及 法 律 、 道 德 问题 
的 文章 有 哪些 。 

阅读 ACM 的 道德 和 职业 行为 守则 和 BCS 的 行为 守则 及 良好 习惯 守则 。 比 较 两 者 的 侧重 点 有 何 
不 同 。 

阅读 新 加 坡 计 算 机 协会 的 行为 守则 ( www.scs.org.sg/code of conduct.php) . 试 分 别 比较 它 与 
ACM 和 BCS 守则 的 差异 。 

考察 第 11 章 给 出 的 DreamHome 案例 研究 。 给 该 公司 负责 人 提交 一 份 报告 ， 列 出 需要 考虑 的 法 
律 和 道德 问题 ， 并 给 出 你 的 合理 化 建议 。 

考察 附录 B 给 出 的 各 个 案例 研究 。 为 每 个 案例 研究 写 一 份 报告 ， 列 出 需要 考虑 的 法 律 和 道德 问 
题 ， 并 给 出 你 的 合理 化 建议 。 

假设 你 是 欧洲 一 所 公立 大 学 的 首席 信息 官 ， 你 将 不 得 不 介入 哪些 数据 管理 问题 ? 你 将 考虑 实施 
哪些 治理 政策 和 过 程 以 保证 符合 法 律 标准 ? 

描述 在 你 的 组 织 机 构 里 实现 怎样 的 IT 治理 机 制 能 改进 IT 和 数据 管理 的 方式 。 

对 于 为 支持 跨国 数据 管理 而 正在 使 用 的 各 种 法 律 框架 ， 举 例 说 明 其 在 保护 公司 和 顾客 隐私 方面 
未 达到 预期 效果 。 
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本 章 目标 

本 章 我 们 主要 学 习 : 

o 并 发 控制 的 目的 
数据 库 恢复 的 目的 
事务 的 作用 和 重要 性 
事务 的 性 质 
串 行 化 的 意义 及 其 在 并 发 控制 中 的 应 用 
如 何 用 锁 机 制 保证 串 行 化 
两 段 锁 协 议 的 工作 原理 
死 锁 的 含义 及 其 解决 方法 
如 何 通过 时 间 改 保证 串 行 化 
乐观 并 发 控制 技术 的 工作 原理 
不 同 级 别 的 锁 机 制 对 并 发 的 影响 
导致 数据 库 故 障 的 部 分 原因 
事务 日 志文 件 的 作用 
事务 日 志 中 检查 点 的 作用 
数据 库 故 障 之 后 如 何 恢复 
几 种 长 寿 事务 模型 
Oracle 如 何 进 行 并 发 控制 和 恢复 


第 2 章 讨 论 了 DBMS (Database Management System, DBMS) 应 该 具备 的 功能 。 其 中 
有 三 个 密切 相关 的 功能 ， 用 以 保证 数据 库 是 可 靠 的、 一 致 的 ， 即 事务 支持 、 并 发 控制 服务 和 
恢复 服务 。 即 使 出 现 了 硬件 或 软件 部 件 的 故障 ， 以 及 在 多 个 用 户 同 时 访问 数据 库 的 情况 下 ， 
DBMS 都 必须 保证 这 种 可 靠 性 和 并 发 性 。 本 章 重点 讲述 这 三 个 功能 。 

虽然 每 个 功能 均 可 单独 论述 , “但 是 它们 之 间 是 相互 依赖 的 。 并 发 控制 和 恢复 主要 用 于 保 
护 数 据 库 ， 避 人 免 数据 库 发 生 数 据 不 一 致 或 者 数据 丢失 。 许 多 DBMS 都 允许 用 户 对 数据 库 进 
行 并 发 操作 。 如 果 对 这 些 操作 不 加 控制 ， 对 数据 库 的 访问 将 相互 干扰 ， 使 得 数据 库 出 现 不 一 
致 的 情况 。 为 了 解决 这 个 问题 ， DBMS 实现 了 并 发 控制 协议 ,来 阻止 数据 库 访问 之 间 的 相互 
干扰 。 

数据 库 恢复 是 指 在 故障 以 后 将 数据 库 还 原 到 正确 状态 的 过 程 。 故 障 发 生 的 原因 可 能 是 硬 
件 错误 而 导致 的 系统 骨 演 、 软 件 错误 、 介 质 故 障 (例如 读 写 头 损坏 ) 或 者 应 用 程序 的 代码 错 
误 〈 例 如 一 个 访问 数据 库 的 程序 中 有 逻辑 错误 )。 数 据 库 管理 员 或 者 用 户 有 意 /无 意 地 对 数据 
或 设备 的 毁损 或 者 破坏 也 会 导致 故障 。 不 管 故障 的 底层 原因 是 什么 ，DBMS 必须 能 够 将 数据 
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库 从 故障 状态 中 重新 恢复 到 正确 的 状态 。 


| 本章 结构 

理解 并 发 控制 和 恢复 的 关键 在 于 事务 这 个 概念 一 一 详 见 22.1 节 。22.2 节 讨 论 并 发 控制 
和 解决 冲突 的 协议 。22.3 节 将 讨论 数据 库 的 恢复 以 及 在 数据 库 出 现 故障 时 维护 数据 库 一 致 状 
态 的 技术 。22.4 节 将 分 析 更 加 先进 的 事务 模型 ， 这 些 事务 模型 的 提出 是 为 了 解决 持续 时 间 较 
长 (可 能 持续 几 个 小 时 甚至 几 个 月 )、 进 度 不 确定 、 从 而 出 现 某 些 无 法 预见 的 行为 的 长 寿 事 
务 。22.5 节 将 讨论 Oracle 的 并 发 控制 和 恢复 技术 。 

本 章 主 要 考虑 集中 式 DBMS 的 事务 支持 、 并 发 控制 和 恢复 ， 集 中 式 DBMS 仅 由 一 个 数 
据 库 组 成 的 。 后 面 的 第 25 章 将 讨论 分 布 式 DBMS 的 上 述 机 制 ， 分 布 式 DBMS 由 多 个 逻辑 
上 相关 却 分 布 在 网 络 各 个 节点 的 数据 库 组 成 。 | 





22.1 支持 事务 处 理 


| 事务 | 由 单个 用 户 或 者 应 用 程序 执行 的 ， 完 成 读 取 或 者 更 新 数据 库 内 容 的 一 个 或 者 一 串 操作 。 


事务 是 数据 库 的 逻辑 操作 单位 。 它 可 以 是 整个 程序 、 部 分 程序 或 者 一 条 命令 (诸如 一 条 
INSERT 或 者 UPDATE 的 SQL 命令 )， 也 可 能 是 涉及 数据 库 的 任意 多 个 操作 。 从 数据 库 的 角 
度 来 看 ， 应 用 程序 的 一 次 执行 就 是 一 个 事务 或 者 多 个 事务 ， 若 看 成 多 个 事务 ， 在 事务 与 事务 
之 间 只 会 出 现 非 数 据 库 操 作 。 为 了 解释 事务 的 概念 ， 首 先 分 析 图 4-3 所 示 的 DreamHome 案 
例 数 据 库 中 的 两 个 关系 : 


Staff (staffNo, fName, IName, position, sex, DOB, salary, branchNo) 
PropertyForRent (propertvNo, street, city, postcode, type, rooms, rent, ownerNo, staffNo, 
branchNo) 


在 该 数据 库 上 执行 的 一 个 简单 事务 为 : 更 新 员工 编号 为 x 的 员工 的 工资 。 可 以 将 此 事 
务 简单 地 表述 成 图 22-1a 所 示 的 程序 。 本 章 ， 我 们 把 对 数据 库 数据 项 x 的 读 、 写 操作 分 别 标 
记 为 read(x) 和 write(x)， 如 果 有 必要 ， 还 会 添加 其 他 的 标记 。 例 如 ， 在 图 22-1a 中 ， 用 标记 
read(staffNo=x, salary) 表示 我 们 想 要 读 取 主 关 键 字 值 为 x 的 元 组 的 数据 项 salary 的 值 。 在 
这 个 示例 中 ,事务 由 两 个 数据 库 操作 ( 读 和 写 ) 和 一 个 非 数 据 库 操作 ( salary=salary * 1.1 ) 
组 成 。 

一 个 更 复杂 的 事务 的 例子 是 : 删除 员工 编号 为 x 的 员工 的 记录 ， 如 图 22-1b 所 示 。 本 
例 要 删除 的 元 组 同样 来 自 关 系 Staff， 并 且 要 在 PropertyForRent 里 找到 所 有 由 该 员工 负责 
管理 的 元 组 ， 然 后 将 其 重新 指派 给 男 外 一 个 员工 编号 为 newStaffNo 的 员工 。 在 这 一 系列 
的 操作 中 ， 知 并 非 所 有 的 操作 都 被 执行 ， 则 数据 库 的 引用 完整 性 将 遭 到 破坏 ， 数 据 库 也 
将 处 于 不 一 致 的 状态 : 一 个 在 数据 库 中 已 经 不 存在 的 员工 还 在 继续 管理 着 公司 的 可 租赁 
房产 。 

在 事务 处 理 过 程 中 ， 尺 管 我 们 允许 数据 库 的 一 致 性 暂时 但 到 破坏 ,但 是 事务 应 该 总 是 能 
够 将 数据 库 从 一 种 一 致 的 状态 转换 到 男 一 种 一 致 的 状态 。 例 如 ， 在 图 22-10 的 事务 执行 过 程 
中 ， 可 能 会 有 某 个 时 刻 ， 此 时 PropertyForRent 的 一 个 元 组 已 经 被 更 新 为 新 的 newStaffNo, 
而 为 外 一 个 元 组 的 员工 编号 依然 是 x。 但 是 在 事务 结束 后 ， 所 有 需要 更 新 的 元 组 都 应 该 包含 
新 的 newStaffNo 的 值 。 
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delete(staffNo = x) 
for all PropertyForRent records, pno 


read(staffNo = x, salary) 
salary = salary * 1.1 read(propertyNo = pno, staffNo) 
write(staffNo = x, salary) if (staffNo = x) then 
begin 
staffNo = newStaffNo 
write(propertyNo = pno, staffNo) 





图 22-1 事务 示例 


事务 可 能 有 以 下 两 种 结果 中 的 一 种 。 如 果 执 行 成 功 ， 也 就 是 说 事务 最 终 被 提交 ， 数 据 库 
也 将 到 达 一 种 新 的 一 致 的 状态 。 另 一 方面 ， 如 果 事 务 没 有 执行 成 功 ， 则 意味 着 事务 被 撤销 。 
如 果 事 务 被 撤销 ， 则 数据 库 必须 要 还 原 到 事务 开始 之 前 的 一 致 的 状态 。 我 们 称 这 样 的 事务 被 
回 滚 或 者 撤销 了 。 已 经 提交 了 的 事务 不 能 被 撤销 。 如 果 发 现 已 提交 的 事务 是 错误 的 ， 我 们 必 
须 执 行 另 外 一 个 补偿 事务 来 消除 该 事务 已 经 产生 的 影响 (参见 22.4.2 节 )。 注 意 ， 根 据 导致 
事务 失败 的 原因 的 不 同 ， 被 回 滚 的 撤销 事务 有 可 能 在 稍 后 重启 ， 或 许 在 重启 以 后 可 以 成 功 热 
行 并 提交 。 

DBMS 无 法 得 知 哪些 更 新 操作 将 被 组 合 在 一 起 以 构成 一 个 独立 的 逻辑 事务 。 因 此 ，DBMS 
必须 提供 一 种 允许 用 户 自 己 定 义 事务 边界 的 方法 。 很 多 数据 操作 语言 中 都 使 用 关键 字 BEGIN 
TRANSACTION, COMMIT 和 ROLLBACK (或 者 其 他 等 效 语句 9) 来 划 定 事务 的 界限 。 如 
果 不 使 用 这 些 分 界 词 ， 通 常会 将 整个 程序 视 为 一 个 事务 ，DBMS 将 在 程序 正确 结束 后 自动 执 
ÍT COMMIT 操作 ， 或 者 如 果 程 序 不 能 成 功 执行 ， 则 将 自动 执行 ROLLBACK 操作 。 

图 22-2 为 事务 的 状态 转换 图 。 注 意 除 了 活跃 (ACTIVE), H3 (COMMITTED) 和 撤销 
(ABORTED) 这 些 显 而 易 见 的 状态 外 ， 还 有 其 他 两 种 状态 : 


COMMIT 











END_TRANSACTION 


BEGIN_TRANSACTION 


图 22-2 事务 的 状态 转换 图 


e 部 分 提交 (PARTIALLY COMMITTED): 当 最 后 一 条 语句 被 执行 后 ， 事 务 可 能 会 处 
于 部 分 提交 状态 。 即 在 这 一 时 刻 ， 有 可 能 发 现 该 事务 破坏 了 可 串 行 化 (参见 22.2.2 
节 ) 或 者 违反 了 完整 性 约束 ， 因 此 事务 必须 被 撤销 。 或 者 ， 系 统 可 能 出 现 故障 ， 事 
务 更 新 的 数据 没有 被 安全 地 写 到 二 级 存储 设备 上 。 在 后 面 两 种 情况 下 ， 事 务 将 进入 
失败 (FAILED) 状态 ， 必 须 被 撤销 。 若 事务 被 成 功 执行 ， 所 做 的 任何 更 新 将 被 安全 


日、 根据 ISO SQL 标准 ， 第 一 个 事务 初始 的 SQL 语句 就 隐 含 实现 了 BEGIN TRANSACTION 的 操作 (参见 7.5 节 )。 
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地 记录 下 来 ， 则 事务 将 进入 COMMITTED 状态 。 

KW (FAILED): 当 事 务 无 法 被 提交 或 者 当 事 务 还 处 于 ACTIVE 状态 时 就 被 撤销 ， 
则 事务 将 处 于 FAILED 状态 。 其 原因 可 能 是 用 户 撤 销 了 事务 或 者 并 发 控制 协议 为 了 
保证 可 串 行 化 而 撤销 了 事务 。 


事务 的 性 质 


有 些 性 质 是 所 有 事务 都 应 该 具备 的 。 事 务 应 该 具有 四 个 基本 性 质 ， 即 ACID 性 质 : 


原子 性 ( Atomicity) : “全 部 或 者 都 不 ”性 质 。 事 务 是 一 个 不 可 分 割 的 单元 ， 要 么 全 
部 执行 ， 要 么 都 不 执行 。 由 DBMS 的 恢复 子 系 统 负责 保证 事务 的 原子 性 。 

一 致 性 (Consistency) : 事务 必须 将 数据 库 从 一 种 一 致 的 状态 转换 到 另 一 种 一 致 的 状 
态 。 事 务 的 一 致 性 是 由 DBMS 和 应 用 程序 的 开发 者 共同 保证 的 。DBMS 可 以 通过 强 
制 实施 所 有 在 数据 库 模 式 中 定义 的 约束 (例如 完整 性 约束 和 企业 自 定义 约束 ) 来 保证 
一 致 性 。 但 这 并 不 能 完全 保证 事务 的 一 致 性 。 例 如 ， 假 设 某 转账 事务 想 要 将 资金 从 
银行 的 某 一 个 账户 转 到 另 一 个 账户 ， 但 是 程序 员 编 写 事务 的 逻辑 时 出 现 了 错误 ， 他 
从 正确 的 账户 上 取出 了 资金 却 转 人 了 错误 的 账户 ， 这 样 数据 库 就 处 于 一 种 不 一 致 的 
状态 。 但 是 产生 这 种 不 一 致 性 并 非 DBMS 的 责任 ， 因 此 DBMS 也 不 必 具 备 检测 这 种 
错误 的 能 力 。 

隔离 性 (Isolation): 事务 的 执行 是 相互 独立 的 。 也 就 是 说 ， 未 完成 事务 的 中 间 结 果 
对 其 他 事务 来 说 应 该 是 不 可 见 的 。 由 并 发 控制 子 系统 负责 保证 事务 的 隔离 性 。 


o 4A (Durability): 成 功 完 成 (提交) 的 事务 的 结果 要 永久 地 记录 在 数据 库 中 ， 不 


能 因为 以 后 的 故障 而 丢失 。 由 恢复 子 系统 负责 保证 事务 的 持久 性 。 


22.1.2 ”数据 库 体系 结构 


第 3 章 讲述 了 DBMS 的 体系 结构 。 图 22-3 是 从 图 3-21 提取 的 与 事务 处 理 、 并 发 控制 
和 恢复 相关 的 四 个 高 层 数 据 库 模块 。 事 务 


管理 器 代表 应 用 程序 协调 事务 的 处 理 。 事 
务 管理 需 与 调度 模块 进行 通信 ， 后 者 负责 
实现 茶 种 并 发 控制 策略 。 如 果 并 发 控制 协 
议 指 的 是 基于 锁 机 制 的 并 发 控制 协议 ， 则 
调度 程序 有 时 候 也 被 看 成 是 锁 管理 器 。 调 
度 程序 的 目标 是 在 不 允许 并 发 事务 互相 干 
扰 的 前 提 下 最 大 限度 地 提高 事务 的 并 发 
度 ， 当 然 可 能 要 牺牲 一 些 数据 库 的 完整 性 
或 一 致 性 。 

如 果 事 务 在 处 理 过 程 中 发 生 故 障 ， 数 
据 库 将 会 处 于 不 一 致 的 状态 。 这 时 将 由 恢 
复 管 理 器 负责 将 数据 库 恢 复 到 事务 开始 前 
的 状态 ， 使 得 数据 库 重 新 处 于 一 致 的 状态 。 
最 后 ， 缓 冲 区 管理 器 负责 在 磁盘 存储 器 和 





数据 库 和 系统 目录 
图 22-3 DBMS 事务 子 系统 


主 存 间 高 效 地 传输 数据 。 


H22¢ FA EH 479 


22.2 ”并 发 控制 


本 节 主 要 分 析 并 发 访问 时 会 出 现 的 问题 以 及 避免 出 现 这 些 问 题 的 相关 技术 。 首 先 ， 介 绍 
并 发 控制 的 定义 。 


| 并 发 控制 | 管理 数据 库 上 的 并 发 操作 以 使 之 互 不 冲突 的 过 程 。 


22.2.1 并 发 控制 的 必要 性 


开发 数据 库 的 一 个 主要 目标 就 是 使 得 多 个 用 户 能 够 并 发 地 访问 共享 数据 。 如 果 所 有 用 户 
都 只 是 读 取 数据 ， 并 发 访问 就 相对 简单 ， 因 为 互相 之 间 不 可 能 产生 干扰 。 但 是 ， 如 果 两 个 或 
者 更 多 的 用 户 同 时 访问 数据 库 ， 并 且 至 少 有 一 个 执行 更 新 操作 ， 则 这 些 操作 之 间 就 有 可 能 相 
互 干 扰 ， 导 致 数据 库 处 于 不 一 致 的 状态 。 

这 个 目标 和 多 用 户 计算 机 系统 的 目标 类 似 ， 后 者 允许 同时 执行 两 个 或 者 多 个 应 用 程序 
(或 者 事务 ) 。 例 如 ， 许 多 系统 都 有 输入 /输出 (VO) 子 系统 ， 输 入 /输出 子 系统 能 够 在 中 央 
处 理 器 (CPU) 执行 某 些 操作 的 同时 ， 独 立地 处 理 IO 操作 。 这 样 的 系统 就 允许 同时 执行 两 
个 或 者 多 个 事务 。 系 统 开 始 执行 第 一 个 事务 直至 第 一 个 IO 操作 ， 在 执行 第 一 个 IO 操作 的 
时 候 ，CPU 挂 起 第 一 个 事务 并 开始 执行 来 自 第 二 个 事务 的 操作 。 当 第 二 个 事务 也 到 达 IO 操 
作 时 ，CPU 控制 又 返回 到 第 一 个 事务 ， 从 事务 刚刚 被 挂 起 的 地 方 继续 执行 。 第 一 个 事务 继 
续 执 行 直 至 再 次 到 达 男 外 一 个 IO 操作 。 通 过 这 种 方法 ， 两 个 事务 的 操作 互相 重 又 ， 并 发 执 
行 。 并 且 ， 在 一 个 事务 执行 VO 操作 的 时 候 ，CPU 并 没有 因为 等 待 该 VO 操作 的 完成 而 处 于 
空闲 的 状态 ， 而 是 继续 执行 其 他 事务 ， 这 种 做 法 提高 了 系统 吞吐 量 ， 即 在 给 定时 间 间 隔 内 完 
成 的 工作 量 。 

虽然 两 个 事务 各 自 执行 时 是 完全 正确 的 ， 但 是 这 种 操作 的 重 芭 方式 却 可 能 产生 不 正确 的 
结果 ， 从 而 破坏 数据 库 的 完整 性 和 一 致 性 。 下 面 我 们 将 举例 分 析 并 发 可 能 导致 的 三 种 问题 : 
丢失 更 新 问题 、 未 提交 依赖 问题 和 不 一 致 分 析 问 题 。 为 了 解释 这 三 种 问题 ， 我 们 利用 一 个 简 
单 的 银行 账户 关系 ， 它 包含 DreamHome 员工 的 账户 信息 。 这 里 把 事务 作为 并 发 控制 的 基本 
单元 。 
| 例 22.1 Ð 丢失 更 新 问题 

一 位 用 户 的 更 新 操作 明明 已 经 成 功 完成 ， 可 是 其 结果 却 被 另外 一 个 用 户 的 操作 结果 取 
代 了 。 这 就 是 通常 所 说 的 丢失 更 新 问题 ， 如 图 22-4 所 示 ， 这 里 事务 Ti 和 事务 T 并 发 执行 ， 
T: 从 余额 为 bals (初始 余额 100 英镑 ) 的 账户 里 取出 10 英镑 ，T, 向 同一 账户 存 人 100 英镑 。 
如 果 这 两 个 事务 串 行 执行 ， 一 个 事务 执行 完 后 再 执行 另外 一 个 事务 ， 没 有 任何 操作 的 重叠 ， 
则 不 管 先 执行 哪 一 个 事务 ， 最 后 的 账户 余额 都 应 该 是 190 英镑 。 


Ti T3 


begin_transaction 


begin_transaction read(bal, ) 


read(bal, ) bal, = bal, + 100 
bal, = bal, — 10 write(bal, ) 
write(bal, ) commit 





commit 


图 22-4 于 失 更 新 闻 题 
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事务 Ti 和 T: 几乎 同时 启动 ， 都 读 取 到 余额 为 100 HP, T 回 bal, HIN 100 英镑 后 
bal, 的 余额 为 200 英镑 ， 最 后 将 更 新 结果 存 人 数据 库 。 同 时 ， 事 务 T 从 bal, 的 副本 上 减 去 
10 英镑 ，bal 的 余额 为 90 英镑 ,Ti 也 将 该 结果 存 人 数据 库 ， 从 而 覆盖 了 前 面 的 更 新 ， 因 此 
“丢失 ”了 先前 添加 到 账户 上 的 100 英镑 。 

要 想 避 免 丢 失 T: 的 更 新 结果 ， 可 以 禁止 Ti EE bal, WA, BEIT. 的 更 新 完成 之 后 。 « 


| 例 22.2 >> 未 提交 依赖 (或 称 污 读 ) 问题 

如 果 人 允许 一 个 事务 看 到 另外 一 个 未 提交 事务 的 中 间 结 果 ， 则 会 出 现 未 提交 依赖 问题 。 图 22-5 
给 出 了 一 个 导致 错误 的 未 提交 依赖 的 示例 ， 余 额 al, 的 初 值 与 例 22.1 中 的 初 值 相同 。 本 例 
中 ， 事 务 Ty 将 bal 更 新 为 200 英镑 ， 但 是 由 于 该 事务 被 撤销 ， 因 此 bal, 应 该 重 置 为 原来 的 
初 值 100 英镑 。 但 是 在 Ts 被 撤销 之 前 ， 事 务 T; 就 已 经 读 取 了 bal, 更 新 后 的 新 值 ( 200 英 
镑 )， 并 且 在 200 英镑 的 基础 上 减 去 了 10 英镑 ， 得 到 了 一 个 不 正确 的 余额 一 一 190 英镑 (应 
为 90 3 BF). Ts 读 取 的 bal, 的 余额 被 称 为 脏 数据 (dirty data)， 该 问题 也 因此 被 称 为 污 读 问 
题 (dirty read problem). 


T4 


begin_transaction 
read(bal,) 
bal, = bal, + 100 


begin_transaction write(bal,) 
read(bal,) : 
bal, = bal, — 10 rollback 
write(bal,) 


commit 





图 22-5 未 提交 依赖 问题 


导致 事务 回 滚 的 原因 很 多 ， 可 能 是 事务 出 现 了 错误 ， 例 如 和 弄 错 了 要 存 钱 的 账号 。 上 述 污 
读 问 题 的 原因 是 T 假设 T, 的 更 新 已 经 成 功 完 成 了 ， 但 是 事实 上 ，T4 的 更 新 随后 被 回 滚 了 。 
如 果 在 Ty 成 功 提交 或 者 撤销 之 前 禁止 T; BERR bal, 就 可 以 避免 此 类 问题 的 发 生 。 ‘< 


示例 中 的 两 个 问题 都 发 生 在 这 样 的 事务 身上 ， 即 事务 试图 更 新 数据 库 ， 并 且 它 们 在 操 
作 上 的 相互 干扰 可 能 会 破坏 数据 库 。 然 而 ， 假 设 允 许 它们 读 取 那些 并 发 更 新 数据 库 且 尚未 成 
功 提交 的 事务 的 中 间 绪 果 的 话 ， 即 使 是 对 数据 库 只 执行 读 操作 的 事务 也 可 能 产生 不 正确 的 结 
采 。 下 面 通过 一 个 示例 来 说 明 这 个 问题 。 


| 例 22.3 >> 不 一 致 分 析 问 题 
当 某 事务 正 从 数据 库 中 读 取 多 个 数据 的 值 ， 但 是 另 一 个 事务 却 在 其 读 取 过 程 中 修改 了 
其 中 某 些 数据 的 值 ， 这 时 就 会 出 现 不 一 致 分 析 问 题 。 例 如 ， 某 一 事务 正在 对 数据 库 中 的 数据 
进行 统计 运算 (比如 说 统计 总 储蓄 额 )， 如 果 在 其 统计 过 程 中 ， 其 他 事务 正在 同时 对 数据 库 
进行 更 新 ， 则 该 事务 将 得 到 一 个 不 正确 的 统计 结果 。 如 图 22-6 所 示 ， 统 计 事 务 Te 与 事务 Ts 
并 发 执行 。 事 务 Te 正在 计算 账户 x (100 英镑 )、 账 户 y (50 英镑 ) 和 账户 z (25 英镑 ) 的 
总 余额 ， 但 是 ， 与 此 同时 事务 Ts 已 经 执行 了 转账 操作 : 将 10 英镑 从 bal, 转 至 balo AE Te 
得 到 了 一 个 错误 的 统计 结果 ( 比 实际 总 余额 多 出 10 英镑 )。 如 果 在 事务 Ts 完成 其 更 新 操作 
之 前 禁止 事务 Te 读 取 bal, 和 bal,， 则 可 以 避免 发 生 此 类 问题 。 < 
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begin_transaction 
begin_transaction sum = 0 
read(bal, ) read(bal, ) 
bal, = bal, — 10 sum = sum + bal, 
write(bal, ) read(bal, ) 


read(bal, ) sum = sum + baly 
bal, = bal, + 10 
write(bal, ) 


commit read(bal, ) 
sum = sum + bal, 


commit 


图 22-6 不 一 致 分 析 问 题 


当 事 务 T 再 次 从 数据 库 中 读 取 它 前 面 已 经 读 取 过 的 数据 项 时 ， 寿 两 次 读 取 操作 之 间 有 
其 他 事务 对 此 数据 进行 了 修改 ， 就 会 出 现 另 一 种 不 一 致 分 析 问 题 。 这 样 ， 对 同一 数据 项 的 
两 次 读 取 , T 居然 得 到 了 两 个 不 同 的 值 。 这 个 问题 有 时 也 被 称 为 不 可 重 (或 模糊 ) 读 问题 。 
还 有 一 种 类 似 的 问题 。 如 果 事 务 T 执 行 某 一 查询 一 一 从 某 关系 中 检索 满足 给 定 谓 词 条 件 的 
元 组 的 集合 ， 稍 后 事务 T 再 次 执行 这 个 查询 ， 却 发 现 这 次 检索 得 到 的 集合 中 还 包括 了 其 他 
(幻象 ) 元 组 ， 这 些 元 组 是 由 同时 执行 的 另外 一 个 事务 插入 的 。 这 个 问题 有 时 也 被 称 为 幻 读 
(phantom read), 


在 讨论 主要 的 并 发 控制 技术 之 前 ， 先 学 习 几 个 与 事务 可 串 行 性 和 可 恢复 性 有 关 的 概念 。 


22.2.2 ARTES A RSH 

并 发 控制 协议 的 目标 就 是 以 一 种 避免 事务 之 间 相 互 干 扰 的 方式 对 事务 进行 调度 ， 从 而 
防止 前 一 节 讲 述 的 各 种 问题 的 发 生 。 一 种 显而易见 的 解决 方案 是 ， 同 一 时 刻 只 允许 一 个 事 
务 执 行 ， 即 一 个 事务 必须 在 上 一 个 事务 提交 (commit) 后 才能 开始 (begin) 执行 。 但 是 ， 多 
用 户 DBMS 的 目标 是 将 系统 的 并 发 度 或 者 并 行 度 最 大 化 ， 使 得 执行 时 互 不 干扰 的 事务 能 
够 得 到 并 行 执 行 。 例 如 ， 访 问 数据 库 不 同位 置 数 据 的 事务 可 以 被 同时 调度 而 互 不 干扰 。 本 
节 将 讨论 可 串 行 性 ， 可 串 行 性 这 种 方法 帮助 我 们 识别 那些 执行 时 能 够 确保 一 致 性 的 事务 
(Papadimitriou，1979 ) 。 本 节 首 先 给 出 一 些 定义 。 


调度 | 一 组 并 发 事务 操作 的 序列 ， 对 于 其 中 每 个 事务 来 说 ， 该 序列 保留 了 该 事务 的 所 有 操 
作 的 先后 次 序 。 


事务 是 由 操作 序列 组 成 的 ， 而 操作 包括 了 对 数据 库 的 读 、 写 动作 ， 以 及 这 些 操作 之 后 进 
行 的 提交 或 者 撤销 动作 。 调 度 Sh n TRE T, To, e, T, 的 操作 序列 组 成 ， 并 且 满 足 约 
R: 调度 S 中 属于 同一 事务 的 操作 的 相对 位 置 保持 不 变 。 因 此 ， 对 于 调度 S 中 的 每 一 个 事务 
TRK, T: 中 操作 的 先后 次 序 要 与 它们 出 现在 调度 S 的 先后 次 序 一 样 。 


| 串 行 调度 | 每 一 个 事务 的 操作 都 按 顺序 执行 且 各 事务 之 间 的 操作 没有 任何 交叉 的 调度 。 


在 串 行 调度 中 ， 事务 以 串 行 的 次 序 执行 。 例 如 ， 如 果 有 两 个 事务 T 和 Tz， 串 行 的 次 序 
就 是 先 执行 Ti 然后 执行 T,， 或 者 先 执行 T; 然后 执行 Ti。 串 行 执行 不 会 出 现 事务 的 相互 干 
扰 ， 因 为 在 任意 给 定时 刻 都 只 有 一 个 事务 在 执行 。 但是， 我 们 无 法 保证 给 定 事务 集 的 所 有 可 
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户 ， 则 对 该 账户 利息 的 计算 结果 取决 于 存款 动作 是 在 计算 利息 之 前 还 是 之 后 执行 的 。. 


| 非 串 行 调度 | 一 组 并 发 事务 的 操作 相互 交叉 执行 的 调度 。 


例 22.1 至 例 22.3 中 讨论 的 问题 都 是 源 于 对 并 发 的 错误 管理 ， 前 两 个 例子 使 得 数据 库 处 
于 不 一 致 的 状态 ， 第 三 个 例子 则 是 将 错误 的 结果 返回 用 户 。 串 行 执行 能 够 避免 此 类 问题 的 
发 生 。 不 管 选择 哪 一 种 串 行 调度 ， 串 行 执行 从 不 会 使 数据 库 处 于 不 一 致 的 状态 ， 因 此 ， 尽 
管 可 能 产生 不 同 的 结果 ， 但 是 所 有 串 行 执 行 都 被 认为 是 正确 的 。 可 串 行 性 的 目标 就 是 寻找 那 
些 既 能 使 事务 并 发 执行 又 互 不 干扰 的 非 串 行 调度 ， 从 而 产生 一 个 能 由 串 行 执行 产生 的 数据 库 
状态 。 

如 果 一 组 事务 并 发 执行 ， 当 且 仅 当 ( 非 串 行 ) 调度 能 够 产生 和 某 些 串 行 执 行 相 同 的 结果 时 ， 
调度 才 是 正确 的 ， 这 样 的 调度 就 被 称 为 是 可 串 行 化 的 。 为 了 避免 由 于 事务 相互 冲突 而 产生 的 
不 一 致 性 ， 必 须 保 证 并 发 事务 的 可 串 行 化 。 在 可 串 行 化 问题 中 ， 读 写 操作 的 次 序 非 常 重要 : 

e 如 果 两 个 事务 都 只 是 读 取 某 一 数据 项 ， 则 它们 之 间 不 会 相互 冲突 ， 这 两 个 事务 的 执 


行 次 序 无 关 紧 要 。 

© 如 果 两 个 事务 要 读 写 的 数据 项 完全 没有 交集 ， 则 它们 不 会 相互 冲突 ， 这 两 个 事务 的 
执行 次 序 无 关 紧 要 。 

© 如 果 一 个 事务 写 某 个 数据 项 ， 而 另 一 个 事务 要 读 或 者 写 同 一 个 数据 项 ， 则 这 两 个 事 
务 的 执行 次 序 就 非常 重要 。 


考虑 图 22-7a 所 示 的 调度 S,，S 包含 了 两 个 并 发 执行 的 事务 T; 和 Ts 的 操作 。 因 为 Ts 
中 对 bal, 的 写 操作 与 接 下 来 的 事务 T; 中 对 bal, 的 读 操作 之 间 没 有 冲突 ， 我 们 交换 这 两 个 操 
作 的 次 序 就 可 以 产生 图 22-7b 中 的 等 价 调度 S:。 如 果 也 改变 下 面 非 冲突 操作 的 次 序 ， 则 会 产 
ERI 22-7c 所 示 的 等 价 调度 Ss: 

e 交换 Ts 的 write (bal:) 和 T7 的 write (bal,) 的 执行 次 序 。 

e 交换 Ts 的 read (bal:) AI T: 的 read (baly) 的 执行 次 序 。 

e 交换 Ts 的 read (bal,) 和 T 的 write (baly) 的 执行 次 序 。 


Time T- Tg Ty Tg T; Ts 
ty begin_transaction begin_transaction begin_transaction 
ty read(bal,) read(bal,) read(bal,) 
t3 write(bal,) write(bal,) write(bal,) 
ta begin_transaction begin_transaction read(baly) 
ts read(bal,) read(bal,) write(baly) 
ts write(bal,) read(bal,) commit 
ty read(bal,) / write(bal,) begin_transaction 
tg write(baly) write(baly) read(bal,) 
ty commit commit write(bal,) 
tio read( baly) read( baly) read( baly) 
thy write(baly) write(bal,) write(baly) 
tio commit commit commit 
a) 非 串 行 调度 $， b) 与 S, 等 价 的 非 串 行 调度 $， c) 与 S、S: 都 等 价 的 串 行 调 度 $， 
图 22-7 等 价 调度 


调度 S; 是 串 行 调度 ， 而 S,、S$: 与 $3 SH, AUS, 和 S: 都 是 可 串 行 化 的 调度 。 


22% FF FH 483 


这 种 类 型 的 可 串 行 化 被 称 为 冲突 可 串 行 化 (conflict serializability ) 。 冲 突 可 串 行 调度 中 
所 有 冲突 操作 的 执行 次 序 与 其 在 某 些 串 行 调度 中 的 执行 次 序 相 同 。 

冲突 可 串 行 化 的 检测 。 在 限定 写 规则 ( 即 事务 更 新 某 数据 项 之 前 总 是 先 读 取 该 数据 项 的 
旧 值 ) 下 ， 总 能 产生 一 个 优先 图 (precedence graph) 或 称 串 行 化 图 serialization graph), FA 
于 检测 调度 是 否 为 冲突 可 串 行 的 。 对 于 调度 S， 其 优先 图 是 一 个 有 向 图 G== (N，E)，G 由 节 
点 的 集合 N 和 有 向 边 的 集合 EE 构成， 构造 方法 如 下 所 示 : 

e 为 每 个 事务 创建 一 个 节点 。 

e 如 果 了 读 取 了 由 了 修改 的 数据 项 的 值 ， 则 创建 有 回 边 T; > Tjo 

o 如 果 T 对 TT; 已 经 读 取 的 数据 项 执行 瑟 操 作 ， 则 创建 有 向 边 Ti 一 Tj。 

e 如 果 TT 对 Ti; 已 经 修改 的 数据 项 执行 了 写 操作 ， 则 创建 有 问 边 Ti 一 To 

如 果 $ 的 优先 图 中 存在 T; 一 的 边 ， 则 在 任何 与 S 等 价 的 串 行 调度 S' 中 ，T 都 必须 出 
现在 Tj 之 前 。 如 果 优 先 图 中 有 环 存 在 ， 则 调度 不 是 冲突 可 串 行 的。 


| 例 22.4 >> 非 冲突 可 串 行 的 调度 

考虑 图 22-8 所 示 的 两 个 事务 。 事 务 To KARRI bal, 的 账户 的 100 英镑 转 至 男 一 个 余额 
为 bal, 的 账户 上 ， 与 此 同时 Tw 将 这 两 个 账户 的 余额 各 增加 了 10%。 图 22-9 是 该 调度 的 优 
先 图 ， 图 中 有 环 存 在 ， 因 此 该 调度 不 是 冲突 可 串 行 的 。 « 


begin_transaction 

read(bal,) 

bal, = bal, + 100 

write(bal,) begin_transaction 
read(bal,) 
bal, = bal, *1.1 
write(bal,) 
read(baly) 
bal, = bal, “1.1 


write( baly) 


read(baly) commit 
baly = bal, — 100 
write(baly) 


commit 





图 22-8 ”两 个 非 冲 突 可 串 行 的 并 发 更 新 事务 图 22-9 图 22-8 所 示 事 务 的 优先 图 ， 因 
图 上 有 环 ， 所 以 该 调度 不 是 冲突 可 串 行 的 
视图 可 串 行 化 
还 有 其 他 几 种 可 串 行 化 ， 它 们 对 等 价 调度 的 定义 并 没有 冲突 可 串 行 化 中 对 等 价 调度 的 定 
义 那 么 严格 。 其 中 一 种 限制 较 少 的 定义 称 为 视图 可 串 行 化 (view serializability)。 调 度 S, 和 
S: Wh n AES T, Ta, e, Trh 的 操作 组 成 ， 如 果 S!、S; 满足 下 面 三 个 条 件 ， 则 S, 、S: 就 
是 视图 等 价 的 : 
e 对 每 一 个 数据 项 x， 如 果 在 调度 S P, 事务 TERT x 的 初 值 ， 那 么 在 调度 S 中 ， 
事务 T; 也 必须 读 取 x 相同 的 初 值 。 
e 在 调度 S| 中 ， 对 于 事务 T; 对 数据 项 x 的 每 一 个 读 操 作 来 说 ， 如 果 T; 读 取 的 x 的 值 是 
由 事务 THAW, 那么 在 调度 S: 中 ,事务 T; 也 必须 要 读 取 由 事务 T 修改 的 x 的 值 。 
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e 对 于 每 一 个 数据 项 x 来 说 ， 如 果 在 调度 S 中 ， 其 最 后 写 操作 是 由 事务 T 执行 的 ， 那 
么 在 调度 S 中 ， 对 数据 项 x 的 最 后 写 操作 也 应 该 由 同一 事务 执行 。 

知 某 调度 视图 等 价 于 一 个 串 行 调度 ， 则 该 调度 是 视图 可 串 行 的 。 所 有 冲突 可 串 行 调度 
都 是 视图 可 串 行 的 ， 反 之 不 成 立 。 例 如 ， 图 22-10 所 示 的 调度 是 视图 可 串 行 的 ， 但 不 是 冲 
突 可 串 行 的 。 在 本 例 中 ,事务 THAT RIAA SREB, RA, NATH a 
写 。 可 以 证 明 ， 对 于 任何 视图 可 串 行 调度 ， 若 其 不 是 冲突 可 串 行 的 ， 则 必然 包含 一 个 或 多 个 - 
BS. 


Tii 


begin_transaction 
read(bal,) 


begin_transaction 
write(bal,) 
commit 
write(bal,) 
commit 
begin_transaction 
write(bal,) 





commit 
图 22-10 不 是 冲突 可 串 行 但 却 是 视图 可 串 行 的 调度 


视图 可 串 行 化 的 检测 。 对 视图 可 串 行 化 的 测试 要 比 对 冲突 可 串 行 化 的 测试 复杂 得 多 。 事 
实 上， 已 经 证 明 对 视图 可 串 行 化 的 测试 是 一 个 NP 完全 (NP-complete) 问题 ， 即 找到 一 个 有 
效 测 试 算法 的 希望 微乎其微 (Papadimitriou，1979 )。 对 于 图 22-10 中 的 调度 ， 我 们 可 以 给 
出 其 (冲突 可 串 行 的 ) 优先 图 ， 如 图 22-11 所 示 。 图 上 存在 的 环 表 示 该 调度 不 是 冲突 可 串 行 
的 ， 但 是 ， 因 为 它 视 图 等 价 于 串 行 调 度 Ti, To, To, N 
此 它 是 视图 可 串 行 的 。 当 我 们 对 上 面 给 出 的 优先 图 的 规则 
进行 分 析 的 时 候 ， 就 可 以 看 到 不 应 该 把 边 Ti 一 Ti 插入 
图 中 ， 因 为 盲 写 的 缘故 ， 没 有 哪个 事务 读 取 了 Tu. Ti 对 
bal, 所 进行 的 修改 。 

因此 ， 为 了 对 视图 可 串 行 化 进行 测试 ， 我 们 需要 一 种 
可 以 决定 某 条 边 是 否 应 该 插入 优先 图 的 方法 。 下 面 就 介绍 
mh ee 图 22-11 图 22-10 所 示 视 图 可 串 行 

> - . ~- AWN 5| H 

(1) 为 每 一 个 事务 创建 一 个 节点 。 Se 测度 的 优先 图 

(2) 创建 节点 Towo Tow 是 在 调度 开始 位 置 插入 的 一 

个 虚拟 事务 ，Tb， 包括 了 对 调度 中 所 有 被 访问 数据 项 的 一 个 写 操作 。 
(3) 创建 节点 Tro Te 是 在 调度 的 最 后 位 置 插入 的 一 个 虚拟 事务 ，Ts 包括 了 对 调度 中 所 
有 被 访问 数据 项 的 一 个 读 操 作 。 

(4) 如果 Tj; 读 取 了 由 T; 修 改 的 数据 项 的 值 ， 则 创建 有 问 边 T: To 

(5) 如 果 T; 没 有 路 径 到 达 Ts， 则 去 掉 所 有 与 T 直接 相连 的 有 向 边 。 

(6) 对 于 每 一 个 由 T; 写 后 Tj 读 过 的 数据 项 ， 如 果 TT. A Tow) 也 对 其 执行 了 写 操 作 ， 则 : 

(a) 如 果 Tj 二 Tow，T 兰 Ts， 则 创建 有 向 边 Ti Tro 
(b) 如 果 T 关 Tow， 荆 二 Ts， 则 创建 有 向 边 Tx- Tio 
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(c) WRTATw, TAT, WEE WA MA Ti 一 TAT; >T, x 是 不 重复 出 现 
的 正 整数 ， 而 且 没 有 用 其 标识 过 前 面 已 经 创建 的 有 向 边 。 这 条 规则 是 前 面 两 条 
规则 的 更 一 般 的 情况 ， 表 明 如 果 事 务 T: 修改 了 某 数据 项 ， 接 着 T 读 取 了 该 数 
据 项 ， 然 后 对 于 任何 事务 T:， 如 果 Ti 要 对 这 一 数据 项 执行 写 操作 ， 则 Ti 要 么 
ET: ZA, 要 么 在 TT 之 后 。 
对 图 22-10 中 的 调度 应 用 前 五 条 规则 ， 生 成 的 优先 图 如 图 22-12a 所 示 。 应 用 规则 
6 (a), RINY TAEMA Ti >T 和 Ti 一 Ti;3， 均 被 标记 为 0 ; 应 用 规则 6 (b)， 增 加 了 
有 问 边 Tn 一 Ta (已 经 增加 ) 和 Tua 一 Ta， 也 都 被 标记 为 0。 最 后 生成 的 优先 图 如 图 22-12b 
所 示 。 





图 22-12 图 22-10 所 示 视 图 可 串 行 调度 的 带 标 记 的 优先 图 


根据 这 个 带 标 记 的 优先 图 ， 对 视图 可 串 行 化 的 测试 如 下 : 
(1) 如 果 图 上 无 环 ， 则 该 调度 为 视图 可 串 行 的 。 
(2) 然而 ， 图 中 存在 环 并 不 足以 说 明 这 个 调度 就 不 是 视图 可 串 行 的 。 实 际 上 检测 应 该 
是 ， 依 据 上 述 规则 6 Cc) 生成 了 m 对 特殊 的 有 问 边 ， 如 果 一 个 图 仅 包 含 每 对 边 中 的 
一 条 ， 则 m 对 有 向 边 就 会 生成 2" 个 不 同 的 图 。 只 要 这 些 图 中 有 一 个 图 是 无 环 的 ， 
则 该 调度 就 是 视图 可 串 行 的 ， 串 行 化 顺序 可 由 去 掉 虚 拟 事 务 Thy 和 Ts 之 后 的 图 的 
拓扑 结构 给 出 。 
我 们 对 图 22-12b 应 用 上 述 方 法 进行 测试 ， 结 果 是 无 环 的 ， 因 此 可 以 得 出 结论 一 一 该 调 
度 是 视图 可 串 行 的 。 考 虑 另外 一 个 示例 ， 我 们 对 图 22-10 稍 作 改动 得 到 了 图 22-13 ， 即 事务 
Toa 与 事务 Ts 相 比 增 加 了 一 个 读 操作 。 应 用 前 五 条 规则 生成 的 该 调度 的 优先 图 如 图 22-14a 
所 示 。 应 用 规则 6 (a)， 我 们 增加 了 有 疝 边 Tn 一 Tis 和 Tu 一 Ti3s*， 均 被 标记 为 0 ; 应 用 规 
则 6 (b),， 增加 了 有 向 边 Tu > Toa (已 经 增加 ) 和 Tua Taa (也 已 经 增加 )， 也 都 被 标记 为 
0; 应 用 规则 6 Cc), 增加 了 一 个 有 癌 边 对 Tn 一 Th 和 Twa 一 Tii， 这 次 都 标记 为 1。 最终 的 
优先 图 如 图 22-14b 所 示 。 因 此 我 们 可 以 得 到 两 个 不 同 的 图 ,每 个 图 都 只 包含 了 这 个 有 向 边 
对 中 的 一 条 边 ， 如 图 22-14c、 图 22-14d 所 示 。 图 22-14c 是 无 环 的 ， 我 们 可 以 得 出 结论 一 一 
这 个 调度 也 是 视图 可 串 行 的 〈《 即 视图 等 价 于 串 行 调度 Tu 一 Ta 一 Tan)。 
实际 上 ，DBMS 并 不 对 调度 是 否 可 串 行 化 进行 检测 。 这 一 点 可 能 不 切实 际 ， 因 为 并 发 
事务 的 操作 次 序 是 由 操作 系统 决定 的 。 但 是 可 以 采用 一 些 普遍 认可 的 协议 来 生成 可 串 行 的 调 
度 。 我 们 将 在 下 一 节 讨 论 这 些 协 议 。 
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Tii 


begin_transaction 
read(bal, ) 


begin_transaction 
write(bal, ) 
commit 
begin_transaction 
read(bal,) 
write(bal, ) 
commit 

write(bal, ) 


commit 


图 22-13 22-10 所 示 调 度 的 修改 版 一 一 增加 了 一 个 读 操作 











c) d) 
图 22-14 图 22-13 所 示 视 图 可 串 行 调 度 的 带 标 记 的 优先 图 

可 恢复 性 

假设 调度 中 每 一 个 事务 都 不 失败 ， 则 可 串 行 化 就 标识 出 那些 能 够 维护 数据 库 一 致 性 的 调 
度 。 从 另 一 方面 看 ， 我 们 还 需 对 调度 中 的 事务 的 可 恢复 性 进行 分 析 。 如 果 事 务 失败 ， 事 务 的 
原子 性 要 求 我 们 必须 撤销 事务 对 数据 库 造 成 的 所 有 影响 。 而 持久 性 要 求 一 旦 提交 后 ， 事 务 对 
数据 库 的 所 有 修改 不 能 被 撤销 (不 包括 执行 另 一 补偿 性 事务 ) 。 我 们 再 来 分 析 一 下 图 22-8 所 
示 的 两 个 并 发 事务 ， 这 次 假设 事务 Te 最 终 没 有 执行 提交 操作 ， 而 是 回 滚 事务 。 而 Tio 已 经 
读 取 了 To 对 bal, 的 修改 结果 ， 并 且 Tio 也 修改 了 bal, 的 值 然后 成 功 提交 。 严 格 来 讲 ，Tio 也 - 
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应 该 回 深 ， 因 为 它 读 取 了 后 来 被 回 深 的 数据 项 bal, 的 值 。 但 是 ， 持 久 性 却 不 允许 这 样 做 。 也 
就 是 说 ， 这 个 调度 是 一 个 不 可 恢复 调度 。 这 就 引出 了 可 恢复 调度 的 定义 。 


可 恢复 调度 | 如 果 Tj 读 取 了 由 Ti 修改 过 的 数据 项 ， 那 么 事务 Ti 的 提交 操作 应 该 在 事务 
的 提交 操作 之 前 。 若 调度 中 的 每 一 对 事务 T; 和 TT 都 能 满足 上 述 要 求 ， 则 该 调度 称 为 可 恢复 
调度 。 


并 发 控制 技术 

串 行 化 可 通过 多 种 方式 实现 。 人 允许 事务 安全 地 并 发 执行 并 且 满 足 某 些 约束 的 并 发 控制 技 
术 主 要 有 两 种 : 加 锁 和 时 间 截 方法 。 

加 锁 和 时 间 蕉 本 质 上 是 保守 (悲观 ) 方法 : 因为 一 旦 在 将 来 某 一 时 刻 发 现 事务 之 间 相 互 
冲突 ， 则 会 推迟 事务 执行 。 后 面 我 们 还 会 讲述 一 些 乐 观 方法 ， 这 些 方法 都 是 基于 如 下 前 提 : 
冲突 出 现 的 概率 很 小 ， 因 此 允许 事务 异步 执行 ， 只 在 最 后 事务 提交 时 再 对 冲突 进行 检测 。 下 
面 我 们 将 对 加 锁 、 时 间 戳 和 乐观 的 并 发 控制 技术 进行 讨论 。 


22.2.3 ”加 锁 方法 


加 锁 | 用 来 控制 并 发 访问 数据 的 过 程 。 当 一 个 事务 正在 访问 数据 库 时 ， 可 以 用 锁 拒 绝 其 他 
事务 的 访问 请 求 ， 从 而 避免 产生 不 正确 的 结果 。 


加 锁 是 使 用 最 为 广泛 的 、 能 够 保证 并 发 事务 可 串 行 化 的 方法 。 尽 管 加 锁 有 几 种 变形 ， 但 
是 基本 特征 相同 ， 即 事务 在 对 数据 库 进 行 读 写 操 作 之 前 必须 获取 一 个 共享 ( 读 ) MMAR 
( 写 ) 锁 。 锁 可 以 阻止 其 他 事务 修改 该 事务 正在 操作 的 数据 项 ， 如 果 是 互 斥 锁 的 话 ， 甚 至 还 
可 以 阻止 其 他 事务 对 该 数据 项 的 读 取 。 加 锁 的 基本 规则 如 下 。 


| 共享 锁 | 如 果 事 务 在 数据 项 上 加 了 共享 锁 ， 则 事务 只 能 读 而 不 能 修改 该 数据 项 。 
| 互 斥 锁 | 如 果 事 务 在 数据 项 上 加 了 互 斥 锁 ， 则 事务 既 可 以 读 也 可 以 修改 该 数据 项 。 


不 同 范 围 的 数据 项 一 一 大 到 整个 数据 库 ， 小 到 一 个 字段 一 一 都 可 以 被 加 锁 。 数 据 项 的 范 
围 决定 了 锁 的 细 度 ， 或 者 说 粒度 ( granularity)。 实 际 的 锁 可 以 如 此 实现 : 在 数据 项 中 增加 一 
个 比特 位 来 指示 该 部 分 是 否 加 锁 ， 或 者 为 数据 库 中 加 锁 的 部 分 维护 一 个 列表 ， 也 可 以 通过 其 
他 方式 实现 。 本 书 将 在 22.2.8 节 进 一 步 讨论 锁 的 粒度 问题 。 下 面 继续 使 用 术语 “数据 项 ”来 
指 代 锁 的 粒度 。 

既然 读 操 作 是 不 冲突 的 ， 就 应 该 允许 多 个 事务 同时 拥有 同一 数据 项 的 共享 锁 。 为 一 方 
面 ， 互 斥 锁 使 得 事务 以 排他 的 方式 对 数据 项 进行 访问 。 因 此 ， 只 要 事务 拥有 了 数据 项 的 互 斥 
锁 ， 那 么 其 他 事务 都 无 法 读 取 或 者 修改 该 数据 项 。 锁 的 使 用 方式 如 下 : 

o 任何 需要 访问 数据 项 的 事务 首先 要 对 数据 项 加 锁 ， 如 果 只 读 则 申请 共享 锁 ， 如 有 果 需 

要 读 写 则 申请 互 斥 锁 。 

© 如 果 数 据 项 没有 被 其 他 事务 加 锁 ， 则 人 允许 事务 对 其 加 锁 。 

e 如 果 数 据 项 已 经 被 加 锁 ， 则 由 DBMS 来 判断 当前 的 加 锁 请 求 是 否 和 已 经 存在 的 锁 相 
容 。 如 果 对 已 经 加 上 共享 锁 的 数据 项 请 求 加 上 共享 锁 ， 则 请 求 被 认可 ; 否则， 事务 
必须 等 待 ， 直 至 现 有 的 锁 被 释放 。 

。 事务 持 有 锁 直 至 它 在 执行 期 间 显 式 地 释放 锁 或 者 它 被 终止 (撤销 或 者 提交 )。 只 有 当 
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互 斥 锁 被 释放 的 时 候 ， 写 操作 的 结果 才 对 其 他 事务 可 见 。 

除了 上 述 规则 ， 某 些 系统 还 允许 事务 对 数据 项 先 加 共享 锁 ， 在 以 后 的 某 个 时 刻 再 将 锁 升 
级 为 互 斥 锁 。 这 实际 上 是 允许 事务 首先 查看 数据 ， 再 决定 是 否 更 新 它 。 若 不 支持 升级 ， 则 事 
务必 须 对 在 执行 期 间 可 能 进行 修改 的 所 有 数据 项 都 加 上 互 斥 锁 ， 这 潜在 地 降低 了 系统 并 发 程 
度 。 出 于 同样 的 原因 ， 一 些 系统 也 允许 事务 先 加 上 一 个 互 斥 锁 ， 稍 后 再 将 其 降级 为 共享 锁 。 

然而 ， 从 例 22.5 中 可 以 看 出 ， 即 使 事务 按照 上 述 规则 使 用 锁 ， 也 不 能 保证 调度 的 可 串 
行 化 。 
| 例 22.5 >) 不 正确 的 加 锁 调 度 

再 次 考虑 图 22-8 中 的 两 个 事务 。 使 用 上 述 加 锁 规则 ， 可 能 会 产生 这 样 一 个 合法 的 调度 : 


S = {write lock(To bal,), read(To bal,), write(To, bal,), unlock(To, bal,), 
write lock(To, bal,), read(T jo, bal,), write(T io, bal,), unlock(CT bal,), 
write_lock(To, bal,), read(Tio bal), write( To, bal,), unlock(To, bal,), 
commit(T1o), write_ lock(ITo bal,), read(T, bal,), write( Tse, bal,), 
unlock(T,, bal,), commit(T,)} 
假设 在 执行 之 前 ，bal= 王 100，bal, 王 400。 如 果 先 执行 Te 然后 执行 Ti。o， 则 结果 为 bal= 
220, baly=330; 如 果 先 执行 Tio 再 执行 Ts， 则 bal.=210，bal, 王 340。 然 而 ， 调 度 S 的 执行 
结果 为 bal, =220, baly=340 (S 不 是 一 个 可 串 行 的 调度 )。 ‘< 


该 例 的 问题 在 于 ， 事务 一 旦 完成 了 对 某 个 加 锁 数据 项 (例如 bal、) 的 读 / 写 操作 并 且 以 
后 不 再 访问 它 时 ， 调 度 就 把 该 事务 拥有 的 这 个 锁 释 放 掉 。 然 而 ,事务 释放 了 加 在 bals 上 的 锁 
以 后 ， 又 对 其 他 数据 项 (bal,) 加 锁 。 虽 然 看 起 来 增加 了 并 发 性 ， 但 是 它 允 许 事务 彼此 干扰 ， 
导致 隔离 性 和 原子 性 全 部 丢失 。 

为 了 保证 可 串 行 化 ， 必 须 遵 循 另 一 个 协议 ， 该 协议 关注 每 一 个 事务 加 锁 、 解 锁 操 作 的 时 
机 。 这 就 是 著名 的 两 段 锁 (Two-Phase Locking, 2PL) 协议 。 
两 段 锁 ( 2PL) 


2PL | 如 果 事 务 中 所 有 的 加 锁 操作 都 出 现在 第 一 个 解锁 操作 之 前 ， 则 该 事务 是 遵循 两 段 锁 协 ， 


议 的 。 

根据 该 协议 的 规则 ， 每 个 事务 可 以 被 分 为 两 个 阶段 : 首先 是 扩展 阶段 ( growing phase), 
在 该 阶段 ， 事务 可 以 获取 它 所 需要 的 全 部 锁 , 但 不 能 释放 任何 一 个 锁 ; 其 次 是 收缩 阶段 
(shrinking phase)， 在 该 阶段 ， 事 务 可 以 释放 它 所 拥有 的 锁 ， 但 不 能 再 获取 任何 新 的 锁 。 协 
议 并 不 要 求 同 时 获取 所 有 的 锁 。 通 常 ， 事务 先 获取 一 些 锁 ， 进 行 相应 的 处 理 ， 然 后 再 根据 需 
要 获取 其 他 锁 。 然 而 ， 事 务 在 到 达 不 再 需要 任何 新 锁 的 阶段 之 前 ， 不 会 释放 任何 锁 。 规 则 
如 下 : 

© 事务 在 对 数据 项 进行 操作 之 前 ， 必 须 先 获得 该 数据 项 的 锁 。 根 据 访 问 的 类 型 需要 ， 

可 以 是 读 锁 或 者 写 锁 。 

© 一 且 事 务 开 始 释 放 锁 ， 它 就 不 能 再 获得 任何 新 锁 。 

如 果 人 允许 锁 的 升级 ， 则 升级 只 能 在 扩展 阶段 进行 ， 并 且 事 务 可 能 需要 等 待 ， 直 至 另 一 个 
事务 释放 加 在 该 数据 项 上 的 共享 锁 。 对 锁 的 降级 只 能 在 收缩 阶段 进行 。 下 面 我 们 就 看 看 如 何 
用 两 段 锁 协议 解决 22.2.1 节 提 到 的 三 个 问题 。 
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| 例 22.6 >> 使 用 2PL 解决 丢失 更 新 问题 

解决 丢失 更 新 问题 的 一 种 方案 如 图 22-15 所 示 。 为 了 防止 丢失 更 新 问题 的 发 生 ，T; 首先 
HPR bal, MAIR. a T; 从 数据 库 中 读 取 bal, 的 值 并 将 其 增加 了 100 英镑 ， 最 后 把 bal, 
的 新 值 写 回 数据 库 。 当 Ti 开始 执行 时 ，T; 也 请 求 对 bal, 加 互 斥 锁 。 但 是 ， 由 于 此 时 bal, 已 
经 被 T: 以 排他 的 方式 加 了 锁 ， 因 此 ，T 的 请 求 无 法 立即 被 满足 ，T' 不 得 不 等 待 ， 直 到 T: 释 
放 其 加 在 bal, 上 的 互 斥 锁 。 而 T: 直到 提交 完成 后 才 释 放 该 锁 。 «< 


T T 


begin_transaction 
begin_transaction write_lock(bal,) 
write_lock(bal,) read(bal,) 
WAIT bal, = bal, + 100 


WAIT write(bal,) 
WAIT commit/unlock(bal,) 
read(bal,) 
bal, = bal, — 10 
write(bal,) 

commit/unlock(bal,) 


图 22-15 防止 出 现 丢 失 更 新 问题 





| 例 22.7 >> 使 用 2PL 解决 未 提交 依赖 问题 

解决 未 提交 依赖 问题 的 一 种 方案 如 图 22-16 所 示 。 为 了 避免 此 类 问题 的 发 生 ，T4 首先 请 
求 对 bal, 加 互 斥 锁 。 然 后 Ts 从 数据 库 中 读 取 bal, 的 值 ， 并 增加 100 英镑 ， 之 后 将 bal, 的 新 
值 写 回 数据 库 。 在 回 滚 时 ， 事 务 Ts 对 数据 库 所 做 的 修改 被 撤销 bal, 的 值 又 被 还 原 到 初 值 
100 英镑 。 当 Ts 开始 执行 时 ，Ts 也 申请 bal, 的 互 斥 锁 。 但 是 ， 因 为 数据 项 bal, CAR T, 以 
排他 的 方式 加 了 锁 ， 所 以 无 法 立即 满足 T: 的 请 求 ，T; 不 得 不 等 待 ， 直 到 Ts 释放 加 在 bal, 上 
的 互 斥 锁 。 而 Ts 只 有 在 执行 完 回 滚 操 作 之 后 才 会 释放 该 锁 。 « 


Ts 


begin_transaction 
write_lock(bal,) 
read(bal,) 
begin_transaction bal, = bal, + 100 


write_lock(bal,) write(bal,) 
WAIT rollback/unlock(bal,) 
read(bal,) 
bal, = bal, — 10 
write(bal,) 

commit/unlock(bal,) 





图 22-16 ”防止 出 现 未 提交 依赖 问题 


| 例 22.8 >> 使 用 2PL 解决 不 一 致 分 析 问 题 

解决 不 一 致 分 析 问 题 的 一 种 方案 如 图 22-17 所 示 。 为 了 防止 出 现 此 类 问题 ，Ts 必须 以 互 
斥 锁 执 行 读 操 作 ， 而 Te 必须 以 共享 锁 执行 其 读 操作 。 因 此 ， 当 Ts 开始 请 求 并 获取 了 bal, 上 
的 互 斥 锁 时 ，Te 试图 对 bal, 加 共享 锁 ， 该 请 求 无 法 立即 被 满足 ，Ts 必须 等 待 直到 Ts 的 锁 被 
释放 ， 即 Ts 必须 等 待 直到 Ts 提交 。 ‘< 
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Ts T 


begin_transaction 
begin_transaction sum = 0 
write_lock(bal,) 
read(bal,) read_lock(bal,) 
bal, = bal, — 10 WAIT 
write(bal,) WAIT 
write_lock(bal, ) WAIT 
read(bal, ) WAIT 
bal, = bal, + 10 WAIT 
write(bal, ) WAIT 
commit/unlock(bal,, bal, ) WAIT 
read(bal,) 
sum = sum + bal, 
read_lock(bal,) 
read(baly) 
sum = sum + baly 
read_lock(bal, ) 
read(bal, ) 
sum = sum + bal, 
commit/unlock(bal,, baly balz) 


图 22-17 防止 出 现 不 一 致 分 析 问 题 
可 以 证 明 ， 如 果 调 度 中 的 每 个 事务 都 遵循 两 段 锁 协议 ， 那 么 该 调度 必然 是 冲突 可 串 行 的 


( Eswaran et al.，1976 ) 。 但 是 ， 在 利用 两 段 锁 协 议 保 证 可 串 行 化 时 ， 锁 的 释放 时 机 仍 会 产生 
问题 ， 见 下 例 。 


| 例 229> 级 联 回 滚 
考虑 如 图 22-18 所 示 的 由 三 个 事务 组 成 的 调度 ， 该 调度 遵循 两 段 锁 协议 。Ti4 获得 了 bal, 
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Ti1a 


begin_transaction 

write_lock(bal, ) 

read(bal, ) 

read_lock(baly ) 

read(baly) 

bal, = bal, + bal, 

write(bal, ) 

unlock(bal, ) begin_transaction 

: write_lock(bal, ) 
read(bal, ) 
bal, = bal, + 100 
write( bal, ) 
unlock(bal, ) 


begin_transaction 
read_lock(bal, ) 


rollback 





rollback 


图 22-18 ”遵循 两 段 锁 协议 的 级 联 回 滚 
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上 的 互 斥 锁 ， 然 后 根据 bal, 的 值 对 bal, HEATER, Tis 事先 已 经 获得 了 bal, 的 共享 锁 ， 并 且 
Tu 在 释放 bal; 的 锁 之 前 将 bal, 的 值 写 回 数据 库 。 接 着 ， 事 务 Tis 获得 了 bal, EAN BM, 
Tis 从 数据 库 中 读 取 bal, 的 值 ， 更 新 bal, FPH bal 的 新 值 写 回 数据 库 ， 然 后 释放 bal, 上 的 
fi. Ha, Tis 对 bal, 加 共享 锁 ， 并 从 数据 库 中 读 取 bal, 的 值 。 此 时 ，Ti 失败 并 回 滚 。 然 而 
因为 Tis 5 Tiu 相关 (Tis ERT H Tu 更 新 的 数据 项 )， 所 以 Tis 也 必须 回 滚 。 同 样 ，Tis 也 与 
Tis 相关 ， 因 此 Tie 也 必须 回 滚 。 这 种 由 于 一 个 事务 引发 的 一 连 串 回 滚 的 现象 被 称 为 级 联 回 
滚 (cascading rollback). «< 


级 联 回 深 是 一 种 不 好 的 现象 ， 这 意味 着 由 于 级 联 回 深 而 导致 大 量 工作 将 被 撤销 。 显 
然 ， 设 计 一 种 避免 级 联 回 滚 的 协议 将 是 很 有 意义 的 。 在 两 段 锁 的 前 提 下 ， 避 免 级 联 回 滚 的 
方法 是 : 就 像 前 面 的 例题 那样 ， 直 到 事务 的 最 后 才 允 许 释 放 所 有 的 锁 。 采 用 这 种 方式 ， 就 
不 会 再 发 生 级 联 回 滚 的 问题 ， 因 为 直到 Tis TREERE, Tis 才 会 获得 bals 的 互 斥 锁 。 这 种 
方法 被 称 为 严格 2PL (rigorous 2PL)。 可 以 证 明 ， 若 事务 均 遵 循 严 格 2PL， 则 事务 将 按 其 
提交 的 顺序 被 串 行 化 。 弱 严格 2PL (strict 2PL) 是 2PL 的 男 一 种 变形 ， 弱 严格 2PL 只 要 求 
互 斤 锁 到 事务 的 最 后 再 释放 。 大 多 数 数据 库 系统 实现 的 是 这 两 种 2PL 变形 中 的 一 种 。 

还 有 另 一 个 与 两 段 锁 有 关 的 问题 ， 这 个 问题 其 实 也 与 所 有 的 加 锁 机 制 有 关 ， 即 由 于 事务 
对 数据 项 锁 的 等 待 而 产生 的 死 锁 〈deadlock)。 如 果 两 个 事务 互相 等 竺 对方 所 持 有 的 数据 项 
上 的 锁 ， 则 产生 和 死 锁 ， 从 而 需要 22.2.4 节 摘 述 的 死 锁 检 测 和 恢复 机 制 。 事 务 也 可 能 处 于 活 锁 
(livelock) 状态 ， 此 时 尽管 DBMS 中 并 未 发 生死 锁 ， 事 务 仍 处 于 无 限期 等 待 状态 中 ， 不 能 获 
得 任何 新 锁 。 当 事务 的 等 待 算法 不 够 公平 ， 并 且 未 考虑 事务 已 经 等 待 的 时 长 时 ， 就 有 可 能 发 
生 这 种 情况 。 为 了 避免 活 锁 ， 可 以 使 用 优先 级 系统 : 事务 等 待 的 时 间 越 长 ， 其 优先 级 就 越 
高 。 例 如 ， 可 以 将 等 竺 事务 放 到 先 来 先 服 务 (first-come-first-served) 的 队列 中 。 
索引 结构 的 并 发 控制 

对 索引 结构 ( 见 附录 FF) 的 并 发 控制 的 管理 ， 可 以 通过 将 索引 的 每 一 页 都 看 作 一 个 数据 
项 ， 并 对 其 应 用 前 面 讲述 的 两 段 锁 协 议 来 进行 。 然 而 ， 由 于 索引 经 常会 被 访问 ， 尤 其 是 树 的 
高 层 (因为 搜索 是 从 根 开 始 往 下 进行 的 )， 所 以 这 种 简单 的 并 发 控制 策略 可 能 会 导致 激烈 的 
锁 苑 争 。 因 此 ， 需 要 对 索引 应 用 一 种 更 高 效 的 加 锁 协议 。 如 果 我 们 分 析 一 下 基于 树 的 案 引 是 
如 何 被 遍历 的 ， 就 会 有 以 下 两 个 发 现 : 

e 搜索 路 径 从 根 开始 ， 一直 癌 下 到 达 树 的 叶 节 点 ， 搜 索 从 不 同上 折返 。 因 此 ， 一旦 一 

个 低层 节点 被 访问 ， 这 条 路 径 上 的 所 有 高 层 节 点 都 不 会 再 被 访问 。 

e 当 一 个 新 的 索引 值 (关键 字 和 指针 ) 被 插入 一 个 叶 节 点 时 ， 如 果 这 个 节点 还 未 满 ， 则 
这 次 插入 不 会 影响 高 层 节 点 。 这 就 意味 着 在 这 种 情况 下 ， 我 们 只 需 对 叶 节 点 加 上 互 
斥 锁 ， 只 有 当 这 个 节点 满 了 ， 需 要 进行 分 裂 时 ， 才 有 必要 对 高 层 节 点 加 上 互 斥 锁 。 

基于 上 述 发 现 ， 我 们 可 以 推导 出 下 面 的 加 锁 策 略 : 

e 检索 时 ， 从 根 节 点 开始 ， 沿 着 相应 的 路 径 向 下 依次 申请 各 个 节点 的 共享 锁 。 一 旦 获 

得 了 某 节 点 的 子 节 点 上 的 锁 ， 则 该 节点 〈 作 为 父 节 点 ) 上 的 锁 可 被 释放 。 

e 插入 时 ， 一 种 保守 的 做 法 是 : 从 根 开始 沿 搜索 路 径 向 下 直到 要 修改 的 叶 节点 ， 对 该 
路 径 上 的 所 有 节点 都 加 上 互 斥 锁 。 这 就 保证 了 叶 节 点 的 一 次 分 裂 总 是 能 够 沿 该 路 径 
向 上 传播 到 每 个 父 节 点 直至 树 的 根 。 但 是 ， 如 果 其 中 某 个 子 节点 不 满 ， 则 其 所 有 父 
节点 上 的 锁 都 可 以 被 释放 。 男 一 种 比较 乐观 的 方法 是 : 除了 要 执行 插入 操作 的 叶 节 
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如 果 叶 节点 需要 分 裂 ， 就 将 其 上 层 父 节点 的 共享 锁 升 级 为 互 斥 锁 。 如 果 父 节点 也 需 
要 进行 分 裂 ， 则 继续 将 其 上 层 节 点 的 锁 升 级 。 在 大 多 数 情 况 下 ， 节 点 并 不 会 分 裂 ， 
因此 这 是 一 种 比较 好 的 方法 。 

这 种 在 可 能 的 情况 下 仅 对 子 节点 加 锁 而 释放 加 在 父 节点 上 的 锁 的 技术 被 称 为 锁 耦 合 
(lock-coupling) 或 者 侧 航 (crabbing)。 关 于 树 的 并 发 控制 算法 性 能 的 进一步 讨论 ， 感 兴趣 的 
读者 可 以 参阅 Srinivasan and Carey ( 1991 ) 。 

锁 存 器 

DBMS 还 支持 男 一 种 称 为 锁 存 器 (latch) 的 锁 。 锁 存 器 的 加 锁 时 间 比 一 般 的 锁 要 短 得 
多 。 在 从 磁盘 读 出 或 写 入 某 一 页 前 ， 可 以 用 锁 存 器 保证 操作 的 原子 性 。 例 如 ， 当 要 把 数据 库 
缓冲 区 的 页 写 人 磁盘 时 ， 需 要 获取 该 页 的 锁 存 器 ， 将 该 页 写 到 磁盘 以 后 ， 锁 存 器 立即 被 释 
放 。 由 于 锁 存 器 仅 用 于 避免 这 类 访问 冲突 ， 因 此 不 需要 遵循 那些 常规 的 并 发 控制 协议 ， 比 如 
两 段 锁 协议 。 


22.2.4 Fil 


| 死 锁 | 当 两 个 (或 多 个 ) 事务 互相 等 待 对 方 释放 自己 已 经 占有 的 锁 时 产生 的 僵局 。 


图 22-19 中 有 两 个 处 于 死 锁 状态 的 事务 Ty 和 Tis， 因 为 它们 都 在 等 待 对 方 释放 上 自己 已 经 
占有 的 数据 项 上 的 锁 。 在 已 时 刻 ， 事 务 Ti 申请 并 获得 了 数据 项 bal WAR; 在 Al, 
事务 Tis 获取 了 数据 项 bal, MAB. HA to 时刻 ，Tv 申请 bal, WABI. HF bal, 的 
锁 正 被 Tis 占有 ， 因 此 事务 T RSH. Ht Al, 事务 Tis HRM bal, 加 锁 ， 而 该 锁 正 
被 事务 T: 持 有 。 这 样 ， 两 个 事务 都 不 能 继续 ， 因 为 两 个 事务 所 申请 的 锁 都 只 有 在 对 方 完 成 
之 后 才能 获取 ， 所 以 出 现 了 相互 等 待 状态 。 一 旦 发 生死 锁 ， 相关 的 应 用 程序 并 不 能 解决 这 个 
问题 。DBMS 必须 能 够 意识 到 死 锁 的 存在 ， 并 通过 某 种 方法 打破 死 锁 。 


Ti7 Tig 


begin_transaction 
write_lock(bal, ) begin_transaction 
read(bal, ) write_lock( baly) 
bal, = bal, - 10 read(baly) 
write(bal, ) bal, = bal, + 100 


write_lock(baly ) write(baly) 
WAIT write_lock(bal, ) 
WAIT WAIT 


WAIT WAIT 
: WAIT 





图 22-19 两 个 事务 间 的 死 锁 


遗憾 的 是 ， 只 有 一 种 方法 能 够 打破 死 锁 : 撤销 其 中 的 一 个 或 多 个 事务 。 这 通常 涉及 撤销 
被 撤销 事务 所 做 的 所 有 修改 。 在 图 22-19 中 ,我 们 可 以 选择 撤销 事务 Tis。 一 旦 Tis 被 撤销 ， 
Tis 占有 的 锁 就 被 释放 ，T1 就 能 够 继续 执行 。 死 锁 应 该 对 用 户 透 明 ， 因 此 DBMS 应 该 自动 
重启 被 撤销 的 事务 。 然 而 ， 实 际 上 DBMS 并 不 能 重启 被 撤销 的 事务 ， 因 为 DBMS 即使 了 解 
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事务 的 历史 ， 也 不 懂事 务 的 逻辑 (除非 事务 中 没有 用 户 的 输入 或 者 输入 不 是 数据 库 状 态 的 
图 数 )。 

有 三 种 常用 的 死 锁 处 理 技术 : 超时 、 死 锁 预 防 以 及 死 锁 检测 和 恢复 。 超 时 是 指 每 个 请 求 
加 锁 的 事务 等 待 的 时 间 都 有 一 个 上 限 。 死 锁 预 防 是 指 DBMS 总 是 提前 判断 是 否 有 事务 会 引 
发 死 锁 ， 从 而 杜绝 死 锁 的 发 生 。 死 锁 检 测 和 恢复 是 指 DBMS 允许 发 生死 锁 ，, 但 是 能 够 认识 
到 死 锁 的 发 生 并 能 够 打破 死 锁 。 与 超时 或 者 检测 到 死 锁 并 打破 死 锁 的 做 法 相 比 ， 预 防 死 锁 的 
难度 要 大 得 多 ， 因 此 ， 系 统一 般 都 不 采用 死 锁 预 防 方法 。 
超时 

这 是 一 种 基于 锁 超 时 的 、 比 较 简 单 的 防止 死 锁 的 方法 。 采 用 这 种 方法 时 ， 会 等 待 加 锁 
的 事务 ， 其 等 待 时 间 最 多 等 于 系统 设 定 的 等 待 时 间 。 如 果 在 这 段 时 间 内 事务 没有 获得 请 求 的 
锁 ， 则 这 次 加 锁 请 求 超时 。 在 这 种 情况 下 ，DBMS 假定 该 事务 已 经 死 锁 (即使 实际 上 可 能 并 
未 死 锁 )， 从 而 撤销 这 个 事务 ， 并 将 其 自动 重启 。 这 是 一 种 非常 简单 又 很 实用 的 防止 死 锁 的 
方案 ， 因 而 被 某 些 商业 DBMS 所 采用 。 

死 锁 预 防 

另 一 种 防止 死 锁 的 方法 是 为 事务 加 上 时 间 戳 从 而 使 事务 有 序 ， 详 见 22.2.5 节 。Rosenkrantz 
等 (1978 ) 提出 了 两 种 死 锁 预防 算法 。 一 种 算法 叫 Wait-Die (等 待 = 死 亡 法 )， 它 只 允许 一 
个 较 老 的 事务 等 待 一 个 较 新 的 事务 ， 否 则 事务 被 撤销 (die)， 并 以 相同 的 时 间 惟 重启 。 这 样 ， 
该 事务 最 终 会 成 为 最 老 的 活跃 事务 ,不 再 会 被 撤销 。 第 二 种 算法 叫 Wound-Wait (伤害 -等 
待 法 )， 它 使 用 相反 的 方法 : 只 允许 一 个 较 新 的 事务 等 待 一 个 较 老 的 事务 。 如 果 一 个 较 老 事 
务 申请 的 锁 已 经 被 一 个 较 新 的 事务 占有 ， 则 较 新 的 事务 被 撤销 (wound). 

一 种 2PL 的 变形 称 为 保守 的 2PL (conservative 2PL) 协议 ， 它 也 能 够 预防 死 锁 的 发 生 。 
根据 保守 的 2PL， 事 务 在 开始 之 前 必须 获得 全 部 的 锁 ， 否 则 就 等 待 ， 直 到 能 获得 全 部 锁 为 
止 。 这 个 协议 的 优越 性 体现 在 ， 如 果 锁 的 竞争 很 激烈 ， 由 于 事务 运行 中 从 不 被 阻塞 ， 因 此 也 
从 不 需要 等 待 锁 ， 所 以 锁 被 占有 的 时 间 就 减少 了 。 另 一 方面 ， 如 果 锁 的 竞争 比较 少 ， 则 在 该 
协议 下 锁 被 占有 的 时 间 就 更 长 。 另 外 ， 因 为 所 有 的 锁 必 须 全 部 获取 并 且 全 部 释放 ， 所 以 加 、 
解锁 的 开销 很 高 。 因 此 如 果 事 务 在 申请 某 个 锁 时 失败 了 ， 则 必须 释放 它 已 经 获得 的 所 有 锁 ， 
以 后 再 重新 申请 这 些 锁 。 从 实际 的 角度 来 看 ， 事 务 在 启动 的 时 候 可 能 不 知道 究 竞 需要 哪些 
锁 ， 因 此 可 能 会 扩大 加 锁 的 范围 。 所 以 ,该 协议 实际 上 并 没有 得 到 应 用 。 

死 锁 检 测 

通常 通过 构造 显示 事务 之 间 依 赖 关 系 的 等 待 图 ( Wait-For Graph, WFG) 进行 死 锁 检测 。 
WE T 持 有 TT 等待 的 数据 项 上 的 锁 ， 则 事务 T 依赖 于 事务 T。WFG 是 一 个 有 向 图 G=(N, 
E), 由 一 组 节点 N 和 一 组 有 向 边 E 构成 。WFG 的 构造 规 
则 如 下 : 

e 为 每 个 事务 创建 一 个 节点 。 

o 如 果 事 务 T 等 待 对 某 数据 项 加 锁 ， 而 该 数据 项 当 

前 已 被 T 加 锁 ， 则 创建 一 条 有 向 边 Ti 一 Tjo 

当 且 仅 当 WFG 中 有 环 时 才 会 发 生死 锁 (Holt，1972 )。 
图 22-20 是 图 22-19 所 示 事 务 的 WFG Ro EA, KEF 图 22-20 有 环 存在 的 WFG， 表 示 
Æ (To Tis Ti). Ask, 可 断言 该 系统 处 于 死 锁 两 个 事务 死 锁 
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状态 。 
死 锁 检测 的 频率 

由 于 等 待 图 中 有 环 存在 是 死 锁 存在 的 充分 必要 条 件 ， 故 死 锁 检 测算 法 可 以 周期 性 地 生成 
等 竺 图， 并 检测 其 中 是 否 有 环 存在 。 执 行 该 算法 进行 死 锁 检 测 的 时 间 间 隅 的 选取 很 重要 。 如 
果 时 间 间 隔 选 得 太 小 ， 那 么 死 锁 检测 将 增加 大 量 的 开销 。 如 果 时 间 间 隔 选 得 太 大 ， 则 即使 发 
生死 锁 ， 也 要 经 过 很 长 一 段 时 间 才 能 被 检测 到 。 另 一 种 方法 是 ， 采 用 动态 死 锁 检测 算法 。 动 
态 死 锁 检 测算 法 以 某 一 初始 时 间 间 隔 被 启动 ， 每 次 执行 时 ， 如 果 没 有 检测 到 死 锁 ， 则 增加 检 
测 时 间 间 隔 ， 比 如 增加 为 原来 的 两 倍 。 如 果 检 测 到 死 锁 ， 则 将 时 间 间 隅 减 小 ， 比 如 减 小 为 原 
来 的 一 半 ， 但 无 论 增加 还 是 减 小 都 不 能 超出 某 个 上 限 和 下 限 。 
死 锁 检测 后 的 恢复 

正如 上 文 提 到 的 ， 一 旦 检测 到 死 锁 ，DBMS 必须 撤销 一 个 或 多 个 事务 。 撤 销 时 ，DBMS 

需要 考虑 这 样 几 个 问题 : 

(1) 对 死 锁 牺 牲 者 的 选择 。 在 某 些 情况 下 ， 可 以 明确 被 撤销 事务 。 但 是 ， 在 另 一 些 情 况 
下 ， 选 择 就 没有 那么 明确 。 在 这 种 情况 下 ， 我 们 就 需要 撤销 那些 代价 最 小 的 事务 。 
主要 考虑 以 下 因素 : 

(a) 事务 已 经 运行 的 时 间 的 长 短 (最 好 撤销 一 个 刚刚 开始 运行 的 事务 ， 而 不 是 一 个 
已 经 运行 了 一 段 时 间 的 事务 )。 

(b) 事务 已 经 更 新 的 数据 项 的 多 少 (最 好 撤销 一 个 只 对 数据 库 做 了 少许 改变 的 事务 ， 
而 不 是 一 个 已 对 数据 库 做 了 大 量 修改 的 事务 )。 

(c) 事务 还 需要 更 新 的 数据 项 的 多 少 (最 好 撤销 一 个 对 数据 库 还 有 许多 更 新 操作 没 
有 完成 的 事务 ， 而 不 是 一 个 只 需 再 做 少量 操作 就 能 完成 的 事务 )。 遗 憾 的 是 ， 
DBMS 未 必 了 解 这 方面 的 信息 。 

(2) 事务 回 滚 的 程度 。 决 定 了 撤销 哪个 事务 以 后 ， 还 要 决定 将 这 个 事务 回 滚 多 远 。 显 
然 ， 撤 销 该 事务 所 做 的 所 有 改变 是 最 简单 的 方法 ， 但 未 必 是 最 高 效 的 方法 。 有 时 ， 
只 需要 事务 部 分 回 滚 就 能 够 解决 死 锁 问 题 。 

(3) 避免 狐 死 。 如 果 某 个 事务 总 被 选 为 牺牲 者 ， 则 可 能 发 生 俄 死 的 现象 一 一 该 事务 永远 
无 法 完成 。 饿 死 现 象 与 22.2.3 节 中 提 到 的 活 锁 很 相似 ， 活 锁 是 并 发 控制 协议 始终 不 
选择 执行 某 个 等 待 加 锁 的 事务 。DBMS 可 以 用 以 下 方法 来 避免 狐 死 现象 的 发 生 : id 
录 事 务 被 选 为 牺牲 者 的 次 数 ， 并 在 该 次 数 到 达 某 上 限时 ， 局 用 另 一 种 选择 标准 。 


22.2.5 ”时间 惟 方 法 


使 用 锁 并 结合 两 段 锁 协 议 即 能 保证 调度 的 可 串 行 化 。 在 等 价 的 串 行 调度 中 ， 事 务 的 先后 
次 序 是 根据 这 些 事 务 对 其 所 需 数据 项 加 锁 的 先后 次 序 决 定 的 。 如 果 一 个 事务 所 需 的 某 个 数据 
项 已 被 加 锁 ， 则 该 事务 只 有 等 待 ， 直 到 此 数据 项 的 锁 被 释放 。 另 一 种 保证 可 串 行 化 的 方法 是 
使 用 事务 的 时 间 戳 ， 从 而 使 得 事务 以 某 种 串 行 调度 的 顺序 执行 。 

与 加 锁 的 方法 相 比 ， 用 时 间 戳 方法 进行 并 发 控制 有 很 大 不 同 。 由 于 不 需要 用 到 锁 ， 因 
此 时 间 戳 方法 不 会 产生 死 锁 。 通 常 ， 加 锁 方 法 是 通过 使 事务 等 竺 来 防止 冲突 。 在 时 间 崔 方 法 
中 ， 事 务 无 需 等 待 : 冲突 的 事务 只 需 简 单 回 滚 并 重启 即 可 。 


| HEIR | DBMS 创建 的 、 标 识 事务 的 相对 启动 时 间 的 、 具 有 唯一 性 的 标识 符 。 
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在 事务 开始 执行 时 ， 可 以 简单 地 用 系统 时 钟 生成 时 间 戳 。 更 常见 的 做 法 是 ， 每 当 有 新 的 
事务 局 动 时 ， 就 将 一 个 逻辑 计数 需 的 值 加 一 。 


时 间 惟 技术 | 一 种 并 发 控制 协议 ， 它 用 以 下 方式 确定 事务 的 顺序 一 一 越 早 的 事务 ， 时 间 蕉 
越 小 ， 在 发 生 冲 突 时 优先 级 越 高 。 


采用 时 间 戳 技术 时 ， 如 果 某 事务 企图 读 或 写 一 个 数据 项 ， 则 只 有 当 该 数据 项 最 近 一 次 
的 修改 是 由 一 个 较 早 的 事务 执行 时 ， 才 允许 该 事务 进行 读 或 写 。 和 否则， 请 求 读 / 写 的 事务 将 
被 赋予 一 个 新 的 时 间 惟 后 重 局 。 为 了 防止 事务 总 是 不 断 被 撤销 、 重 启 ， 在 事务 重启 时 必须 为 
其 分 配 新 的 时 间 戳 。 和 否则， 可 能 由 于 较 新 的 事务 已 经 提交 ， 使 得 持 有 旧时 间 惟 的 事务 无 法 
提交 。 

除了 事务 有 时 间 惟 ， 数 据 项 也 可 以 有 时 间 戳 。 每 个 数据 项 都 有 一 个 读 时 间 戳 (read_ 
timestamp)， 其 全 为 最 后 一 个 读 取 该 数据 项 的 事务 的 时 间 惟 ; 数据 项 还 有 一 个 写 时 间 戳 
( write_timestamp)， 其 值 为 最 后 一 个 写 (更 新 ) 该 数据 项 的 事务 的 时 间 戳 。 对 于 一 个 时 间 玲 
为 ts (T) 的 事务 T， 时 间 戳 排序 协议 的 工作 原理 如 下 : 

(1) 事务 T 发 出 读 请求 read(x)。 

(a) 事务 T 要 求 读数 据 项 (x)， 而 该 数据 项 已 经 被 一 个 较 新 ( 较 晚 ) 的 事务 更 新 ， 即 

ts(T) 二 write_timestamp(x)。 这 表示 一 个 较 早 的 事务 试图 读 取 一 个 由 较 新 事务 更 新 
的 数据 项 的 值 。 这 个 较 早 的 事务 现在 才 来 读 一 个 以 前 存在 过 而 现在 已 经 被 更 新 了 
的 值 ， 显 然 太 迟 了 ， 而 且 它 已 经 获得 的 其 他 值 很 有 可 能 与 这 个 已 经 被 更 新 的 数据 
项 的 值 不 一 致 。 在 这 种 情况 下 ,事务 T 必须 被 撤销 ， 并 以 一 个 新 ( 较 晚 ) AT 
重启 。 

(b) 否则 ，ts(T) 三 write_timestamp(x)， 则 读 操作 可 以 被 执行 ， 并 且 置 read_timestamp(x)= 
max(ts(T), read_timestamp(x)). 

(2) 事务 T 发 出 写 请 求 write(x)。 

(a) 事务 T 要 求 写 数据 项 (x)， 而 该 数据 项 已 经 被 一 个 较 新 的 事务 读 取 ， 即 ts(T)<read_ 
timestamp(x)。 这 说 明 一 个 较 新 的 事务 已 经 使 用 了 该 数据 项 的 当前 值 ， 如 果 事 务 T 
现在 更 新 它 ， 就 会 出 错 。 当 一 个 事务 延误 了 对 数据 项 的 写 ， 而 男 一 个 较 新 的 事务 
却 已 经 读 取 了 该 数据 项 以 前 的 值 或 已 经 写 人 了 一 个 新 值 ， 在 这 种 情况 下 就 会 出 错 。 
此 时 ， 唯 一 的 解决 办 法 是 将 事务 T 回 深 并 且 用 一 个 新 的 时 间 礁 重启 。 

(b) 事务 T 要 求 写 数据 项 (x)， 而 该 数据 项 已 经 被 一 个 较 新 的 事务 更 新 ， 即 ts(T)<write_ 
timestamp(x)。 这 说 明 事务 了 试图 向 数据 项 x 写 入 一 个 应 该 在 前 面 时 刻 存在 而 此 时 
已 属 陈旧 的 值 。 所 以 事务 T 应 该 被 回 滚 并 且 用 一 个 新 的 时 间 戳 重启。 

(c) 否则 ， 写 操作 可 以 被 执行 ， 并 且 置 write_timestamp(x)=ts(T). 

这 种 称 为 基本 时 间 戳 排序 的 模式 ， 能 够 保证 事务 是 冲突 可 串 行 的 ， 并 且 结 果 等 价 于 这 
样 一 个 串 行 调度 ， 即 事务 按照 时 间 戳 的 大 小 顺序 执行 。 换 名 话说 ， 其 结果 就 好 像 是 先 执行 事 
务 1 的 所 有 操作 ， 然 后 执行 事务 2 的 全 部 操作 ， 如 此 下 去 ， 其 间 没 有 交叉 。 但 是 ， 基 本 时 间 
堆 排 序 并 不 能 保证 调度 的 可 恢复 性 。 在 演示 如 何 使 用 上 述 规则 产生 一 个 基于 时 间 戳 的 调度 之 
前 ， 先 来 分 析 一 个 稍 作 变 化 的 协议 ， 该 协议 能 够 提供 更 高 的 并 发 性 。 
托马斯 写 规则 

通过 对 基本 时 间 惟 排序 协议 进行 修改 ， 放 宽 对 冲突 可 串 行 化 的 要 求 ， 拒 绝 过 时 的 写 操 
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作 以 获得 更 高 的 并 行 性 (Thomas，1979 ) 一 一 该 扩展 被 称 为 托马斯 写 规则 ( Thomas’s write 
rule)。 该 规则 修改 了 事务 T 的 写 操 作 规 则 : 

(a) 事务 T 要 求 写 数据 项 (x)， 而 该 数据 项 已 经 被 一 个 较 新 的 事务 读 过 ， 即 ts(T)<read_ 
timestamp(x)。 同 前 面 一 样 ， 将 事务 工 回 滚 并 且 用 一 个 新 的 时 间 戳 重 局 。 

(b) 事务 T 要 求 写 数据 项 (x)， 而 该 数据 项 已 经 被 一 个 较 新 的 事务 更 新 过 ，B ts(T)<write_ 
timestamp(x)。 这 说 明 一 个 较 新 的 事务 已 经 更 新 了 该 数据 项 的 值 ， 因 此 ， 较 早 的 
事务 (T) 要 写 人 的 值 ， 必 须 是 在 一 个 更 加 陈旧 的 值 的 基础 上 写 和 人 入。 在 这 种 情况 
下 ， 和 忽略 写 操作 毫 无 问题 。 这 有 时 也 被 称 为 忽略 过 时 写 规则 (ignore obsolete write 
rule)， 这 种 规则 支持 更 高 的 并 发 性 。 

(c) 否则 ， 与 此 前 一 样 ， 写 操作 可 以 被 执行 。 然 后 置 write_timestamp(x) 一 ts(T)。 

采用 托马斯 写 规则 可 以 产生 本 节 讨 论 的 其 他 并 发 协议 不 可 能 产生 的 调度 。 例 如 ， 在 

图 22-10 中 给 出 的 调度 是 非 冲突 可 串 行 的 : 事务 Tu 在 事务 Ta 之 后 对 bal 的 写 操 作 将 被 拒 
绝 ， 则 Tu 将 被 回 深 ， 并 使 用 一 个 新 的 时 间 惟 重启 。 但 是 ， 如 果 使 用 托马斯 写 规则 ， 这 种 视 
图 可 串 行 的 调度 将 被 视 为 是 合法 的 ， 没 有 事务 需要 回 滚 。 

下 一 节 将 讨论 另外 一 种 基于 数据 项 的 多 个 版 本 的 时 间 戳 协议 。 


| 例 22.10 >> 基本 时 间 戳 排序 

在 图 22-21 中 ， 有 三 个 事务 在 并 发 执行 。 事 务 Tio 的 时 间 惟 为 ts(Ti9)， 事 务 Tro 的 时 间 
惟 为 ts(Tzo0)， 事 务 Ta AY AY [Al BLY ts(T21), H. ts(T19)<ts(T20)<ts(T21). Æ ts A, 344 Tro 
的 写 操作 违反 了 第 一 条 写 规则 ， 因 此 To 被 撤销 ， 并 在 ts 时 刻 重 启 。 在 ts 时 刻 ， 根 据 忽略 
过 时 写 规 则 ， 事 务 To 的 写 操 作 被 安全 地 忽略 ， 因 为 该 写 操作 的 结果 早 就 应 该 被 事务 Tr 在 
tio 时 刻 的 写 操 作 所 覆盖 。 « 


Tig 


begin_transaction 
read(bal,) read(bal,) 
bal, = bal, + 10 bal, = bal, + 10 
write(bal,) write(bal,) begin_transaction 
read(baly) read(baly) 
baly = bal, +20 baly = baly +20 begin_transaction 
read( baly ) read(baly ) 
write(baly ) write(bal, )® 
bal, = bal, + 30 bal, = bal, + 30 
write(baly) write( bal,) 
bal, = 100 bal, = 100 
write(bal,) write(balz) 
bal, = 50 bal, = 50 commit 
write(bal,) write(bal,)® begin_transaction 
read(baly) commit read( baly) 
bal, = bal, + 20 bal, = bal, + 20 
write(bal,) write(bal, ) 


commit 


, SFT, HERAT A- RHR, Att, FFT, RMA, HAMA, 


D 在 时 刻 ts， 根据 忽略 过 时 写 规则 ， 事 务 Ti, 的 写 操作 被 安全 地 忽略 ， 因 为 这 次 写 操作 早 就 应 该 
被 事务 T,, 在 时 刻 ti, 时 刻 的 写 操 作 和 覆盖 。 


图 22-21 时间 戳 示例 
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各 种 方法 的 比较 

图 22-22 显示 了 冲突 可 串 行 化 (CS)、 
视图 可 串 行 化 (VS)、 两 段 锁 (2PL) 和 时 
ek (TS) 间 的 关系 。 可 以 看 到 ， 视 图 可 
串 行 化 包含 了 其 他 三 种 方法 ， 冲 突 可 串 行 
化 则 包含 了 两 段 锁 和 时 间 戳 ， 而 两 段 锁 和 
Nee SRB. HER, BAP 
况 意味 着 ， 存 在 着 同时 满足 两 段 锁 和 时 间 
稚 规 则 的 调度 ， 但 是 也 存在 着 只 能 根据 两 图 22-22 冲突 可 串 行 化 (CS), WATPIE (VS), 
段 锁 协议 产生 的 或 只 能 由 时 间 截 规则 产生 两 段 锁 (2PL) 以 及 时 间 蕉 (TS) 之 间 的 比较 
的 调度 。 


22.2.6 ”多 版 本 时 间 戳 排序 


通过 将 数据 版 本 化 还 可 以 增加 并 发 性 ， 因 为 这 样 就 允许 不 同 的 用 户 并 发 地 对 同一 个 对 
象 的 不 同 版 本 进行 操作 ， 而 不 必 等 到 其 他 事务 结束 时 再 访问 这 一 对 象 。 在 任 一 阶段 ， 万 一 
某 操作 出 现 了 错误 ， 都 能 够 将 该 操作 回 滚 到 某 个 合法 的 状态 。 版 本 被 用 于 22.4 Wie WH ik 
套 和 多 级 并 发 控制 协议 (比如 可 以 参见 Beech and Mahbod, 1988 和 Chou and Kim, 1986, 
1988 ) 。 本 节 将 简要 介绍 一 种 并 发 控制 机 制 ， 该 机 制 在 时 间 戳 的 基础 上 使 用 版 本 来 增加 并 
发 性 (Reed, 1978; 1983). 22.5 节 将 简要 地 讨论 Oracle 是 如 何 使 用 这 种 机 制 进行 并 发 控 
制 的 。 

在 前 一 节 讨论 的 基本 时 间 惟 排序 协议 中 ， 我 们 假设 数据 项 只 有 一 个 版 本 ， 因 此 ， 同 一 时 
刻 只 能 有 一 个 事务 访问 该 数据 项 。 如 果 人 允许 多 个 事务 读 或 写 同 一 个 数据 项 的 不 同 版 本 ， 并 能 
保证 每 个 事务 所 访问 的 数据 项 的 版 本 是 一 致 的 ， 则 可 以 放宽 前 面 所 述 的 限制 。 在 多 版 本 的 并 
发 控制 中 ,每 次 写 操作 都 在 保留 原 有 版 本 的 同时 ， 又 为 数据 项 创建 了 一 个 新 版 本 。 当 某 事务 
试图 读 一 个 数据 项 时 ， 系 统 将 为 其 选择 一 个 能 够 保证 可 串 行 化 的 数据 项 版 本 。 

对 每 个 数据 项 x， 假 设 数据 库 中 保留 了 x 的 于 个 版 本 xi，x，…，xne 系统 为 每 个 版 本 ; 
存储 了 三 个 值 : 

e 版 本 x, 的 值 。 

è read timestamp(x,) 是 所 有 成 功 读 取 了 版 本 xi 的 事务 的 时 间 戳 中 的 最 大 值 。 

è write timestamp(x,) 是 创建 版 本 x; 的 事务 的 时 间 惟 。 

A ts(T) 为 当前 事务 的 时 间 戳 。 多 版 本 时 间 惟 排序 协议 使 用 下 面 两 条 规则 来 保证 可 串 





行 化 : 

(1) 事务 T 发 出 写 请 求 write(x)。 如 果 事 务 T 了 要 写 数据 项 x， 则 必须 保证 该 数据 项 尚未 

被 另 一 事务 T(ts(T) 达 ts(T))) 读 取 过 。 因 为 出 于 可 串 行 化 的 考虑 ，T 所 做 的 改变 应 该 

ATL, WER, WE TT 在 较 早 时 刻 就 已 经 读 取 了 该 数据 项 的 值 ， 那 么 它 是 不 
ZMA T 的 修改 结果 的 。 

因此 ,假设 数据 项 x 的 版 本 xy 具有 最 大 写 时 间 崔 ， 其 值 小 于 或 者 等 于 ts(T) ( 即 

write timestamp(x;)<ts(T)), {fii read_ timestamp(x)>ts(T)， 则 事务 T 必 须 被 撤销 

并 以 一 个 新 的 时 间 戳 重启。 否则， 可 为 数据 项 x 创建 一 个 新 的 版 本 x, JF read_ 


timestamp(x;)—write_timestamp(x;)=ts(T). 
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(2) 事务 TT 发 出 一 个 读 请 求 read(x)。 如 果 允 许 事务 T 读 取 数 据 项 x， 则 必须 返回 数据 
项 x 的 写 时 间 戳 小 于 或 者 等 于 ts(CT) 的 诸 版 本 中 时 间 惟 最 大 的 那个 x， 即 x 的 write_ 
timestamp(x;) 要 满足 write timestamp(x;)<ts(T). ® read_timestamp(x;)=max(ts(T), 
read_timestamp(x)))。 注 意 ， 在 此 协议 下 ， 读 操作 从 不 失败 。 
一 旦 某 个 版 本 不 再 使 用 ， 就 可 以 将 其 删除 。 根 据 当 前 系统 中 最 早 的 事务 的 时 间 惟 来 决定 
是 否 还 需要 某 个 版 本 。 对 于 数据 项 x 的 任意 两 个 版 本 x; 和 x， 若 它们 的 写 时 间 戳 比 当前 系统 
中 最 早 事务 的 时 间 戳 还 小 ， 则 可 以 删除 其 中 较 早 的 一 个 版 本 。 


22.2.7 ”乐观 技术 


在 某 些 情 况 下 ,事务 之 间 很 少 发 生 冲 突 ， 因此， 由 锁 或 者 时 间 惟 协议 带 来 的 一 些 额 外 
操作 对 许多 事务 来 说 都 是 不 必要 的 。 乐 观 技术 (optimistic technique ) 基于 很 少 发 生 冲 突 这 
一 假设 ， 因 此 无 需 为 保证 可 串 行 化 而 延迟 事务 执行 ， 从 而 更 加 高 效 ( Kung and Robinson, 
1981 )。 当 事务 准备 提交 时 ， 将 对 其 进行 检验 ， 以 确定 是 否 有 冲突 存在 。 如 果 确 实 存 在 溃 
突 ， 则 事务 被 回 滚 并 重启 。 由 于 前 提 是 发 生 冲突 的 概率 很 低 ， 因 此 回 滚 的 概率 也 很 小 。 由 于 
回 滚 实 际 上 意味 着 重 做 整个 事务 ， 因 此 事务 重启 的 开销 可 能 相当 可 观 。 只 有 当 神 突 发 生 的 概 
率 很 低 ， 即 大 多 数 事务 不 会 被 延迟 执行 时 ， 这 种 开销 才 是 可 以 接受 的 。 由 于 不 需要 加 锁 ， 乐 
观 技术 能 比 传统 的 协议 提供 更 高 的 并 发 性 。 

根据 事务 是 只 读 事务 还 是 更 新 事务 ， 乐 观 的 并 发 控制 协议 可 以 分 为 两 到 三 个 阶段 : 

e 读 阶 段 。 读 阶段 从 事务 开始 直到 事务 提交 前 的 一 刻 。 事 务 从 数据 库 中 读 取 所 有 它 需 

要 的 数据 项 的 值 ， 并 将 其 存放 在 本 地 变量 中 。 更 新 操作 只 在 数据 的 本 地 副本 上 进行 ， 
并 不 修改 数据 库 本 号 。 

e 确认 阶段 。 读 阶段 之 后 就 是 确认 阶段 。 为 了 确保 将 事务 的 更 新 结果 写 人 数据 库 后 不 
会 破坏 可 串 行 化 ， 必 须 对 事务 进行 检验 。 对 于 只 读 事 务 ， 检 验 该 事务 读 取 的 数据 值 
是 否 是 对 应 数据 项 的 当前 值 。 如 果 没 有 冲突 存在 ， 则 事务 可 以 提交 。 如 果 出 现 冲 突 ， 
则 事务 被 撤销 并 重启 。 对 于 更 新 事务 ， 要 检验 该 事务 是 否 使 得 数据 库 处 于 一 致 的 状 
态 ， 并 维持 了 可 串 行 化 。 如 果 不 满足 ， 则 撤销 事务 并 重启 。 

© 写 阶 段 。 对 于 更 新 事务 ， 成 功 通过 确认 阶段 之 后 就 进入 了 写 阶 段 。 在 这 一 阶段 ， 将 
把 本 地 副本 的 修改 结果 反映 到 数据 库 中 。 

确认 阶段 要 检验 事务 的 读 写 操作 是 否 出 现 了 冲突 。 在 每 个 事务 T 开始 执 行 时 ， 就 被 赋予 
了 一 个 时 间 惟 start(T)， 进 入 事务 确认 阶段 时 又 被 赋予 了 时 间 蕉 validation(T)， 在 事务 结束 时 
(如 果 有 写 阶 段 ， 则 被 包括 在 内 ) MAT BEA finish(T)。 要 通过 确认 检查 ， 则 至 少 要 满足 以 
下 条 件 中 的 一 条 : 

(1) 在 事务 了 开始 执行 之 前 ， 所 有 具有 较 早 时 间 惟 的 事务 S 都 必须 结束 ， 即 finish(S) 

<start(T). 

(2) MRS T 在 一 个 较 早 的 事务 S 结束 之 前 开始 ， 则 : 

(a) 较 早 的 事务 所 写 的 数据 项 并 不 是 当前 事务 读 取 的 数据 项 。 
(b) 在 当前 事务 进入 确认 阶段 之 前 ， 较 早 的 事务 已 经 完成 了 其 写 阶 段 ， 即 start(T)< 
finish(S)<validation(T). 

规则 2 Ca) 保证 了 较 早 事 务 写 操作 的 结果 没有 被 当前 事务 读 取 ; 规则 2 Cb) 保证 了 写 操 
作 是 串 行 执行 的 ， 不 会 发 生 冲 突 。 
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虽然 在 冲突 很 少 发 生 的 情况 下 ， 乐 观 技 术 非 常 高 效 ， 但 它 会 造成 个 别 事务 的 回 滚 。 注 
意 ， 这 里 的 回 深 只 涉及 数据 的 本 地 副本 ， 并 没有 真正 对 数据 库 写 ， 因 此 不 会 导致 级 联 回 深 。 
然而 ， 如 采 被 撤销 的 事务 是 那 种 执行 时 间 较 长 的 事务 ， 就 会 因为 事务 的 重 局 浪费 大 量 处 理 时 
间 。 如 采 回 滚 经 党 发 生 ， 则 表明 对 于 这 种 环境 下 的 并 发 控制 ， 采 用 乐观 的 方法 是 一 种 失败 的 
选择 。 


22.2.8 数据 项 的 粒度 
| 粒度 | 受到 保护 的 数据 项 的 大 小 ， 是 并 发 控制 协议 中 受到 保护 的 基本 单位 。 


此 前 讨论 过 的 所 有 并 发 控制 协议 都 假设 数据 库 由 大 量 的 “数据 项 ”组 成 ， 但 并 未 明确 定 
义 什 么 是 数据 项 。 数 据 项 通常 有 如 下 的 选择 ， 按 粒度 从 粗 到 细 排 列 ， 细 粒度 是 指 比 较 小 的 数 
据 项 ， 粗 粒度 是 指 较 大 的 数据 项 : 
整个 数据 库 
EP 
一 页 《有 时 也 称 为 一 个 区 间或 数据 库 空 间 ， 即 存储 关系 的 物理 磁盘 上 的 一 块 ) 
一 条 记录 
记录 的 一 个 字段 的 值 

在 一 次 操作 中 可 被 加 锁 的 数据 项 的 大 小 (或 者 说 粒度 )， 对 并 发 控制 算法 的 全 局 性 能 有 
很 大 的 影响 。 但 是 ， 在 选择 数据 项 的 大 小 时 ， 需 要 权衡 许多 因素 。 尽 管 对 其 他 并 发 控制 技术 
也 可 以 进行 类 似 的 讨论 ， 但 是 我 们 只 讨论 在 加 锁 技 术 中 如 何 进 行 权 衡 。 

考虑 仅 修 改 一 个 元 组 的 事务 。 并 发 控制 算法 可 以 允许 事务 仅 对 一 个 元 组 加 锁 ， 在 这 种 情 
况 下 ， 加 锁 粒 度 的 大 小 就 是 一 条 记录 。 男 外 ， 也 可 以 对 整个 数据 库 加 锁 ， 此 时 加 锁 粒度 的 大 
小 就 是 整个 数据 库 。 在 第 二 种 情况 下 ， 这 个 粒度 会 阻塞 其 他 事务 的 执行 ， 直 到 锁 被 释放 。 这 
显然 是 不 理想 的 。 男 一 方面 ， 如 果 某 事务 要 更 新 某 文 件 中 95% 的 记录 ， 那 么 令 该 事务 对 整 
个 文件 加 锁 ， 而 不 是 对 每 条 记录 分 别 并 多 次 加 锁 ， 两 者 相 比 ， 前 者 效率 更 高 。 然 而 ， 将 加 锁 
的 粒度 从 字段 或 者 记录 增 大 为 文件 ， 也 会 增加 发 生死 锁 的 可 能 性 。 

因此 ， 数 据 项 的 粒度 越 粗 ， 则 并 发 程度 越 低 。 男 一 方面 ， 数 据 项 的 粒度 越 细 ， 就 需要 存 
储 越 多 的 加 锁 信 息 。 最 佳 数 据 项 的 大 小 应 该 根据 事务 的 性 质 来 决定 。 如 果 一 个 典型 事务 的 访 
问 只 涉及 少量 的 记录 ， 则 数据 项 的 粒度 最 好 为 记录 级 的 。 但 是 ， 如 果 一 个 典型 事务 的 访问 需 
要 涉及 同一 个 文件 中 的 多 条 记录 ， 则 最 好 将 数据 项 粒度 定 为 页 或 者 文件 ， 这 样 ， 事 务 就 能 将 
所 有 的 记录 看 作 一 个 (JLA) 数据 项 。 

有 人 还 提出 了 一 些 动 态 数 据 项 大 小 的 技术 。 在 这 些 技术 中 ， 根 据 当 前 执行 的 事务 的 类 型 
对 数据 项 的 大 小 进行 调整 ， 使 其 最 适合 这 些 事务 的 执行 。 理 想 情况 下 ，DBMS 应 该 能 支持 
记录 级 、 页 级 以 及 文件 级 的 混合 粒度 。 当 某 事务 对 文件 中 超过 某 个 百 分 值 的 记录 或 者 页 加 锁 
时 ,一 些 系统 会 自动 将 锁 从 记录 级 或 者 页 级 升级 到 文件 级 。 
粒度 的 层次 

我 们 可 以 用 层次 结构 表示 锁 的 粒度 ， 如 图 22-23 所 示 ， 其 中 每 个 节点 代表 一 种 数据 项 的 
大 小 。 其 中 ， 根 节点 代表 整个 数据 库 ， 第 一 层 节 点 代表 文件 ， 第 二 层 节 点 代表 页 ， 第 三 层 节 
点 代表 记录 ， 第 四 层 叶 节点 代表 单个 字段 。 当 一 个 节点 被 加 锁 时 ， 其 所 有 的 子孙 节点 都 被 锁 
住 。 例 如 ， 如 果菜 事务 对 页 Page, 加 锁 ， 则 该 页 所 有 的 记录 (Record, 和 Record.) 和 记录 下 
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所 有 的 字段 ( Field, A Field.) 都 被 加 了 锁 。 如 果 另 有 一 事务 请 求 对 同一 节点 加 一 个 不 相 容 


的 锁 ， 则 DBMS 清楚 地 知道 不 能 满足 这 一 事务 的 
加 锁 请 求 。 

如 果 男 有 一 个 事务 请 求 对 已 被 加 锁 节点 的 任 
意 子孙 节点 加 锁 ， 则 DBMS 先 检查 从 根 到 请 求 节 
点 的 层次 路 径 ， 确 定 其 祖先 节点 是 否 已 被 加 锁 ， 
然后 再 决定 是 否 同 意 对 请 求 节 点 加 锁 。 因 此 如 果 
加 锁 请 求 是 对 记录 Record, 加 互 斥 锁 ， 则 DBMS 
首先 检查 其 父 节 点 ( Page; )， 再 检查 其 祖父 节点 
(File: )， 最 后 检查 数据 库 本 身 ， 看 看 它们 之 中 是 
否 有 节点 已 被 加 锁 。 当 发 现 Page. 已 被 加 锁 时 ， 
DBMS 就 会 拒绝 此 次 加 锁 请 求 。 

另外 ， 事 务 可 能 会 请 求 对 一 个 其 子孙 节点 已 
被 加 锁 的 节点 加 锁 。 例 如 ， 若 某 事务 请 求 对 File. 
加 锁 ， 则 DBMS 需要 首先 检查 该 文件 中 (File> ) 
的 所 有 页 、 这 些 页 中 的 所 有 记录 以 及 这 些 记录 中 
的 所 有 字段 ， 确 定 它 们 中 的 任意 一 个 是 否 已 被 加 
fi, 然后 才能 决定 是 否 允 许 对 File; 加 锁 。 
多 粒度 加 锁 

为 了 减少 对 子孙 节点 加 锁 情 况 的 搜索 ， 
DBMS 采用 另外 一 种 称 为 多 粒度 加 锁 (multiple- 
granularity locking) 的 专门 的 加 锁 策 略 。 该 策略 使 
用 了 一 种 新 型 锁 一 一 意向 锁 (intention lock) (Gary 








22-23 ”加 锁 的 层次 图 








第 0 层 


第 1 层 


第 2 层 


第 3 层 


第 4 层 


et al.，1975 )。 当 一 个 节点 被 加 锁 时 ， 该 节点 的 所 有 祖先 节点 就 都 被 加 了 意向 锁 。 因 此 ， 如 
AL File: 的 茶 个 子孙 节点 (如 前 例 中 的 Page.) 被 加 锁 ， 当 有 对 File: 的 加 锁 请 求 时 ，Filez 上 


的 意 癌 锁 则 会 表明 它 的 某 个 子孙 节点 已 经 被 加 锁 。 


意 问 锁 可 以 是 共享 的 (S) MAA (X). BHF (Intention Shared, IS) 锁 只 与 互 斥 
锁 冲 突 ， 意 向 互 斥 ( Intention eXclusive, IX) 锁 与 共享 锁 和 互 斥 锁 均 冲突 。 另 外 ， 事 务 可 以 
拥有 共享 意向 互 斥 ( Shared and Intention eXclusive, SIX) 锁 ， 这 与 同时 拥有 一 个 共享 锁 和 
一 个 意向 互 斥 锁 在 逻辑 上 是 等 价 的 。SIX 锁 与 所 有 与 共享 锁 或 者 意向 互 斥 锁 冲 突 的 锁 冲 突 ， 
换 句 话说 ，SIX 锁 仅 与 IS 锁 兼 容 。 表 22-1 所 示 为 多 粒度 加 锁 技 术 中 各 种 锁 之 间 的 兼容 性 。 


R 22-1 多 粒度 加 锁 技 术 中 各 种 锁 之 间 的 兼容 性 


注 : V=RS, X=KRS 


DWA AS E: xX] xX] xX 
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为 了 保证 多 级 加 锁 的 可 串 行 化 ， 使 用 下 述 两 段 锁 协 议 : 

© 一 旦 有 节点 被 解锁 ， 就 不 再 继续 加 锁 。 

e 直到 其 父 节点 被 加 了 意 回 锁 ， 才 人 允许 对 该 节点 加 锁 。 

© 直到 其 所 有 的 子孙 节点 都 被 解锁 ,该 节点 才 可 以 被 解锁 。 

根据 上 述 规则 ， 申 请 锁 时 ， 应 从 根 节点 目 上 而 下 ， 每 层 均 加 上 意 回 锁 ， 直 到 遇 到 了 真正 
要 被 加 上 共享 锁 或 者 互 斥 锁 的 那个 节点 ; 释放 锁 时 ， 目 下 而 上 地 进行 。 然 而 ， 应 用 该 协议 仍 
然 可 能 发 生死 锁 ， 对 死 锁 的 处 理 如 前 所 述 。 


22.3 ”数据 库 恢复 


| 数据 库 恢复 | 在 发 生 故 障 时 ， 将 数据 库 还 原 到 正确 状态 的 过 程 。 


在 本 章 的 开篇 ， 我 们 曾 介 绍 过 数据 库 恢 复 的 概念 : 作为 DBMS 必须 提供 的 一 种 服务 ， 
数据 库 恢 复 机 制 能 够 保证 数据 库 的 可 靠 性 ， 能 够 保证 在 发 生 故 障 的 情况 下 ， 也 能 使 数据 库 处 
于 一 致 的 状态 。 这 里 ,可靠 性 既 指 DBMS 对 各 种 故障 的 适应 能 力 ， 也 指 其 从 故障 中 恢复 的 
能 力 。 本 节 考 虑 的 是 如 何 实 现 这 种 服务 。 为 了 更 好 地 理解 在 实现 一 个 可 徘 系统 时 可 能 会 遇 到 
的 问题 ， 我 们 从 恢复 的 必要 性 以 及 数据 库 环境 里 可 能 发 生 的 故障 开始 分 析 。 


22.3.1 恢复 的 必要 性 


通常 有 四 种 不 同类 型 的 数据 存储 介质 ， 硅 按 可 靠 性 递增 的 顺序 排序 ， 这 四 种 存储 介质 
为 : 主 存储 器 、 磁 盘 、 磁 带 和 光盘 。 主 存储 顺 是 易 失 性 存储 器 ， 大 系统 前 溃 ， 则 不 能 幸免 ， 
数据 全 失 。 磁 盘 属 于 联机 非 易 失 存 储 器 。 与 主 存储 锅 相 比 ， 磁 盘 更 可 靠 也 更 便宜 ， 但 是 要 慢 
三 到 四 个 数量 级 。 磁 带 是 一 种 非 联 机 非 易 失 存储 介质 ， 与 磁盘 相 比 ， 更 可 靠 、 更 便宜 ， 但 更 
慢 ， 且 只 能 文 持 串 行 访问 。 光 盘 比 磁带 更 可 靠 ， 通 稼 也 更 便宜 、 更 快 ， 且 文 持 随 机 访问 。 主 
存储 融通 向 被 称 为 一 级 存储 器 ， 磁 盘 和 磁带 通 稼 被 称 为 二 级 存储 器 。 稳 定 存 储 是 指 已 被 复制 
到 许多 非 易 失 的 、 具 有 独立 故障 模式 的 存储 介质 (通常 指 磁盘 ) 上 的 信息 。 例 如 ， 可 以 利用 
RAID (Redundant Array of Independent Disk， 独 立 磁盘 见 余 阵列 ) 技术 来 模拟 实现 稳定 存储 ， 
RAID 技术 能 够 保证 单个 磁盘 发 生 故 障 〈 即 使 故障 发 生 在 数据 传输 的 过 程 中 )， 也 不 会 导致 数 
HER (参见 20.2.7 节 )。 

影响 数据 库 处 理 的 故障 有 许多 种 ， 每 一 种 故障 的 处 理 方法 都 不 同 。 一 些 故 障 只 影响 主 存 
储 器 ， 但 有 一 些 故 障 会 影响 非 易 失 (二 级 ) 存储 右 。 故 障 的 原因 包括 : 

© 系统 崩溃 。 由 于 硬件 或 软件 错误 产生 的 系统 谣 溃 将 导致 主 存储 器 中 的 数据 丢失 。 

© 介质 故障 。 比 如 磁头 损坏 盘 片 或 者 介质 不 可 读 ， 介 质 故障 将 导致 二 级 存储 需 的 数据 丢失 。 

e 应 用 软件 错误 。 比 如 访问 数据 库 的 程序 中 的 逻辑 错误 ， 这 一 类 错误 将 导致 一 个 或 多 

个 事务 失败 。 

© 自然 物理 灾害 。 比 如 火灾 、 水 灾 、 地 震 或 者 断 电 。 

© 玻 忽 。 操 作 人 员 或 者 用 户 由 于 无 心 之 失 而 造成 对 数据 或 者 设备 的 破坏 。 

。 鞭 意 破坏 。 故 意 损毁 或 者 破坏 数据 、 硬 件 、 软 件 设 备 。 

不 管 故障 产生 的 原因 是 什么 ,我 们 都 需要 考虑 这 样 两 个 基本 的 影响 : 包括 数据 库 缓冲 区 
在 内 的 主 存储 需 的 数据 丢失 ; 数据 库 磁盘 数据 的 丢失 。 在 本 章 的 其 余部 分 ， 主 要 讨论 能 将 影 
响 最 小 化 以 及 与 故障 恢复 相关 的 概念 与 技术 。 
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22.3.2 事务 和 恢复 


事务 是 数据 库 系统 进行 恢复 的 基本 单位 。 故 障 发 生 时 ， 由 恢复 管理 器 人 负责 保证 事务 ACID 
特性 中 的 原子 性 和 持久 性 。 恢 复 管理 需 必 须 保证 在 故障 恢复 以 后 ， 某 事务 的 操作 结果 要 么 全 
部 都 被 永久 地 记录 在 数据 库 中 ， 要 么 什么 都 不 留 下 。 实 际 情 况 很 复杂 ， 由 于 数据 库 写 并 不 是 
一 个 原子 〈 一 步 就 完成 的 ) 操作 ， 因 此 ， 很 有 可 能 产生 这 种 情况 : 尽管 事务 已 经 提交 ,但 是 其 
结果 还 并 未 全 部 、 永 久 性 地 记录 在 数据 库 中 ， 只 因为 它们 还 没有 被 送 达 数 据 库 。 

再 来 看 看 本 章 举 的 第 一 个 例子 ， 如 图 22-1a 所 示 ， 该 例 为 增加 某 位 员工 的 工资 的 操作 。 
为 了 完成 读 操 作 ，DBMS 执行 下 列 步 又 : 

© 找到 主 关 键 字 为 x 的 记录 所 在 的 磁盘 块 的 地 址 。 

© 将 该 磁盘 块 传送 到 内 存 的 数据 库 缓 冲 区 。 

© 将 数据 库 缓 冲 区 中 的 工资 数据 复制 给 变量 salary. 

为 了 完成 写 操作 ，DBMS 执行 下 列 步 又 : 

e 找到 主 关 键 字 为 x 的 记录 所 在 的 磁盘 块 的 地 址 。 

© 将 该 磁盘 块 传送 到 内 存 的 数据 库 绥 冲 区 。 

e 将 工资 数据 从 变量 salary 复制 到 数据 库 缓冲 区 。 

e 将 数据 库 缓冲 区 的 数据 写 回 磁盘 。 

数据 库 绥 冲 区 位 于 内 存 ， 用 于 在 内 存 和 二 级 存储 怖 之 间 传 递 数 据 。 只 有 缓冲 区 中 的 数据 
被 刷新 到 二 级 存储 器 中 ， 更 新 操作 才能 被 看 作 是 永久 性 的 。 缓 冲 区 到 数据 库 的 刷新 操作 可 以 
被 某 个 特殊 的 命令 触发 (比如 事务 提交 )， 也 可 以 在 缓冲 区 满 时 自动 进行 。 缓 冲 区 到 二 级 存 
储 颖 的 显 式 写 被 称 为 强制 写 (force-writing)。 

如 果 在 写 缓 冲 区 和 将 缓冲 区 数据 写 (刷新 ) 到 二 级 存储 器 之 间 发 生 了 故障 ， 恢 复 管理 器 
必须 确定 当 故 障 发 生 时 正在 执行 写 操作 的 事务 的 状态 。 如 果 该 事务 已 经 执行 了 提交 ， 则 为 了 
保证 持久 性 ， 恢 复 管 理 器 必须 重 做 (redo) 该 事务 对 数据 库 的 所 有 修改 操作 ， 也 称 为 向 前 滚 
(rollforward ) 。 

另 一 方面 ， 如 果 在 故障 发 生 时 该 事务 还 未 提交 ， 则 恢复 管理 需 必 须 撤 《 销 (undo) BER 
(rollback) 该 事务 对 数据 库 已 做 的 所 有 修改 ， 以 保证 事务 的 原子 性 。 如 果 只 有 一 个 事务 需要 
被 撤销 ， 则 称 为 部 分 撤销 (partial undo ) 。 如 前 一 节 所 述 ， 当 根据 某 并 发 控制 协议 需 将 事务 
回 滚 并 重 局 时 ,- 调 度 程序 触发 部 分 撤销 动作 。 事 务 也 可 以 单方 面 执行 撤销 ， 例 如 ， 由 用 户 或 
者 是 应 用 程序 中 的 某 个 异常 条 件 触发 。 当 所 有 的 活跃 事务 都 必须 被 撤销 时 ， 称 为 全 局 撤销 
(global undo). 


| 例 22.11 >> 撤销 (UNDO) / 重 做 (REDO) 的 应 用 

图 22-24 显示 了 一 组 并 发 执行 的 事务 Ti，…， 
Tso DBMS 在 tf 时刻 启动 ， 在 tt 时 刻 出 现 故 障 。 
假设 在 故障 发 生前 ， 事务 T: AT; 的 数据 已 经 被 
写 到 二 级 存储 器 。 

显然 ， 当 故障 发 生 时 ,Ti 和 Ts 还 未 提交 。 
因此 在 重启 时 ， 恢 复 管 理 需 必须 撤销 (undo) 事 
务 T 和 Tes。 然 而， 恢复 管理 器 并 不 清楚 另外 两 
个 (已 提交 ) 事务 Ty 和 Ts 所 做 的 哪些 修改 已 经 图 22-24 UNDO/REDO 示例 
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被 写 人 了 位 于 非 易 失 存储 器 上 的 数据 库 里 。 之 所 以 不 确定 ， 是 因为 易 失 数据 库 缓冲 区 里 的 数 
据 可 能 已 经 被 写 和 磁盘， 也 可 能 还 未 来 得 及 写 人 磁盘 。 在 缺乏 更 多 信息 的 情况 下 ， 人 恢复 管理 
做 不 得 不 重 做 (redo) 事务 ax Lau Ta 和 Tso 《他 


缓冲 区 管理 
对 数据 库 缓 冲 区 的 管理 在 恢复 的 过 程 中 起 着 重要 的 作用 。 因 此 讲述 恢复 机 制 之 前 ， 我 们 
先 简要 地 介绍 缓冲 区 的 管理 。 正 如 在 本 章 开 始 曾 提 到 的 ， 缓冲 区 管理 颖 负责 高 效 地 管理 数据 
库 缓 冲 区 ， 数 据 库 缓冲 区 则 负责 将 页 写 人 二 级 存储 器 以 及 从 二 级 存储 器 读 出 页 。 这 包括 将 页 
从 磁盘 读 出 并 写 人 缓冲 区 ， 直 到 所 有 缓冲 区 满 ， 然 后 利用 某 种 替换 策略 来 决定 将 哪个 〈 些 ) 
缓冲 区 强制 写 到 磁盘 ， 以 便 为 后 面 要 从 磁盘 上 读 出 的 新 页 让 出 空间 。 替 换 策 略 有 先进 先 出 
( First-In-First-Out, FIFO) 和 最 近 最 少 使 用 (Least Recently Used，LRU)。 另 外 ， 当 数据 库 
缓冲 区 里 已 经 存在 某 页 时 ， 绥 冲 区 管理 句 就 不 必 再 从 磁盘 上 读 取 该 页 。 
一 种 方法 是 利用 两 个 变量 pinCount 和 dirty 来 记录 与 每 个 数据 库 缓 冲 区 有 关 的 管理 信 
息 ， 初 始 值 均 为 0。 当 从 磁盘 上 请 求 某 页 时 ， 绥 冲 区 管理 器 将 检查 该 页 是 否 已 经 存在 于 某 个 
数据 库 缓 冲 区 里 。 如 果 不 在 ， 则 : 
(1) 缓冲 区 管理 器 根据 替换 策略 选择 一 个 缓冲 区 页 进行 页 的 奉 换 〈 称 为 替换 缓冲 区 页 )， 
该 缓冲 区 页 的 pinCount 的 值 加 1。 意 即 正在 被 请 求 的 页 被 钉 住 (pinned) 在 数据 库 
缓冲 区 中 ， 不 能 将 被 钉 住 的 页 写 回 磁 盘 。 因 此 替换 策略 不 会 选择 一 个 正 被 钉 住 的 组 
冲 区 页 作为 替换 缓冲 区 页 。 
(2) 如 果 替 换 缓 冲 区 页 的 变量 dirty 的 值 被 修改 过 ( 即 不 为 0)， 则 缓冲 区 管理 融 将 该 组 
冲 区 页 写 回 磁盘 。 
(3 ) 缓冲 区 管理 器 从 磁盘 将 请 求 页 读 到 替换 缓冲 区 页 ， 并 重 置 该 缓冲 区 页 的 变量 dirty 
的 值 为 0。 
如 果 再 次 请 求 相 同 的 页 ， 则 与 该 页 相对 应 的 pinCount 的 值 加 1。 当 系统 通知 缓冲 区 管理 
器 它 已 经 结束 了 对 该 页 的 使 用 时 ， 则 将 相应 的 pinCount 的 值 减 1。 此 时 ， 系 统 还 会 通知 缓冲 
区 管理 器 该 页 是 否 曾 被 修改 ， 并 根据 修改 与 否 设 置 变量 dirty 的 值 。 当 pinCount 的 值 变 为 0 
时 ， 称 该 页 未 钉 住 (unpinned)， 如 果 该 页 曾 被 修改 过 ( 即 变 量 dirty 的 值 被 修改 过 )， 则 可 将 
其 写 回 磁盘 。 
在 数据 库 恢 复 中 ， 当 页 被 写 回 磁盘 时 ， 会 用 到 下 列 术语 : 
© 偷窃 策略 (steal policy) 允许 缓冲 区 管理 融 在 事务 提交 前 将 缓冲 区 (缓存 区 为 未 钉 住 
的 ) 写 回 磁盘 。 也 就 是 说 ， 缓 冲 区 管理 器 从 事务 那里 偷 了 一 页 。 与 其 对 应 的 则 是 非 
偷窃 (no-steal) 策略 。 
o 强制 策略 (force policy) 保证 在 事务 提交 时 ， 事 务 更 新 的 所 有 页 立即 被 写 回 磁盘 。 与 
其 对 应 的 是 非 强制 (no-force) 策略 。 
从 实现 的 角度 来 说 ， 最 简单 的 方法 是 使 用 非 偷 禄 策略 和 强制 策略 : 使 用 非 偷窃 策 略 时 ， 
我 们 无 需 撤销 (undo) 一 个 已 撤销 的 事务 所 做 的 更 改 ， 因 为 这 些 修改 结果 还 未 被 写 回 磁盘 ; 
使 用 强制 策略 时 ， 就 无 需 在 系统 月 演 时 重 做 (redo) 一 个 已 经 提交 事务 所 做 的 更 改 ， 因 为 所 
有 的 更 新 在 提交 时 就 已 被 写 回 磁盘 。 接 下 来 要 讨论 的 延迟 修改 恢复 协议 使 用 的 就 是 非 偷 锚 
策略 。 
从 另 一 方面 看 ， 若 有 一 组 并 发 事务 运行 ， 则 要 存储 这 组 事务 的 所 有 更 新 页 将 需要 巨大 的 
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缓冲 空间 ， 这 实际 上 是 不 现实 的 ， 使 用 偷窃 策略 可 避免 这 种 情况 的 发 生 。 此 外 ， 非 强制 策略 
的 一 个 显著 优点 是 : 当 一 个 较 新 的 事务 修改 一 个 较 早 的 已 提交 事务 修改 过 的 页 时 ， 该 页 可 能 
还 在 数据 库 缓冲 区 里 ， 因 此 也 就 不 必 再 次 从 磁盘 读 入 该 页 。 出 于 以 上 原因 ， 大 多 数 DBMS 
使 用 偷窃 且 非 强制 策略 。 


22.3.3 恢复 机 制 


DBMS 应 该 提供 以 下 机 制 以 支持 数据 库 的 恢复 : 

e 备份 机 制 : 周期 性 地 对 数据 库 进行 备份 。 

e 日 志 机 制 : 跟踪 当前 事务 的 状态 与 数据 库 的 变化 。 

e 检查 点 机 制 : 能 够 保证 正在 进行 的 对 数据 库 的 更 新 操作 的 永久 性 。 

e 恢复 管理 器 : 能 够 使 得 数据 库 在 故障 以 后 仍 能 恢复 到 一 个 一 致 的 状态 。 
备份 机 制 

DBMS 应 该 提供 某 种 机 制 ， 使 得 系统 能 够 定期 备份 数据 库 和 日 志文 件 ( 见 下 面 的 讨论 )， 
而 且 除 非 必 要 ， 和 否则 就 不 应 先 停 止 系统 的 运行 再 备份 。 数 据 库 的 备份 可 以 在 数据 库 被 损坏 或 
者 被 毁坏 时 使 用 。 备 份 可 以 是 对 整个 数据 库 的 复制 ， 也 可 以 是 递增 备份 ， 递 增 备份 中 只 包含 
最 近 一 次 完全 备份 或 者 递增 备份 以 后 被 修改 的 数据 。 通 常 ， 备 份 被 存储 到 脱 机 存储 介质 ， 比 
如 磁带 。 

日 志文 件 

为 了 跟踪 数据 库 事务 的 执行 进度 ，DBMS 中 维护 着 一 种 特殊 的 文件 一 一 日 志 (log), 也 
称 为 日 记 (journal) 或 流水 账 (journal), 日 志 中 记录 了 对 数据 库 的 所 有 更 新 信息 。 日 志 中 可 
能 包含 下 列 数 据 : 

e 事务 记录 ， 包 括 : 

@ 事务 标识 符 。 

e 日 志 记 录 的 类 型 (事务 开始 、 插 入 、 更 新 、 删 除 、 撤 销 、 提 交 )。 

m 对 数据 库 的 动作 (插入 、 删 除 和 更 新 操作 ) 所 影响 到 的 数据 项 的 标识 符 。 

m 数据 项 的 前 像 (before-image)， 即 数据 项 被 修改 之 前 的 值 ( 仅 指 更 新 和 删除 操作 )。 
m 数据 项 的 后 像 (after-image)， 即 数据 项 被 修改 以 后 的 值 ( 仅 指 插 入 和 更 新 操作 )。 

e 日 志 管 理 信息 ， 比 如 指向 某 事务 (所 有 操作 ) 的 前 一 条 或 下 一 条 日 志 记 录 的 指针 。 

e 检查 点 记录 ， 将 在 稍 后 介绍 。 

除了 帮助 系统 进行 恢复 以 外 ， 日 志 还 可 以 用 于 性 能 监测 和 和 审计。 在 这 些 情况 下 ， 需 要 
在 日 志文 件 中 添加 额外 的 信息 (比如 ， 数 据 库 读 、 用 户 登录 、 注 销 等 )， 不 过 这 些 信息 与 
恢复 无 关 ， 因 此 这 里 略 去 不 谈 。 图 22-25 是 某 日 志文 件 的 一 段 ， 表 明 当 时 有 三 个 并 发 执 
行 的 事务 Ti、T: 和 T3。 列 pPtr 和 nPtr 代表 指向 每 个 事务 的 前 一 条 和 后 一 条 日 志 记 录 的 
指针 。 

由 于 事务 的 日 志文 件 在 恢复 处 理 中 的 重要 性 ， 因 此 日 志 需 要 被 双 倍 或 三 倍 地 复制 ( 即 保 
存 两 到 三 个 独立 的 副本 )， 这 样 ， 如 果 其 中 的 一 个 副本 遭 到 破坏 ， 也 还 有 男 一 个 副本 可 用 。 
以 前 ， 日 志文 件 是 存储 在 磁带 上 的 ， 因 为 磁带 比 磁 盘 更 可 靠 、 更 便宜 。 但 是 ， 现 在 的 DBMS 
希望 能 够 迅速 地 从 较 小 的 故障 中 恢复 。 这 就 要 求 日 志文 件 要 被 存储 在 联机 的 、 可 快速 直接 访 
问 的 存储 设备 上 。 
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图 22-25 某 日 志文 件 的 一 段 


在 某 些 情况 下 ， 每 天 会 产生 大 量 的 日 志 信息 (每 天 产生 10MB 的 日 志 量 是 很 寻常 的 )， 
因此 不 可 能 总 是 将 所 有 的 日 志 信 息 都 联机 保存 。 但 是 为 了 从 较 小 的 故障 中 快速 恢复 〈 比 如 死 
锁 之 后 事务 的 回 滚 )， 又 需要 将 日 志文 件 联 机 保存 。 对 于 较 大 的 故障 ， 比 如 磁盘 读 写 头 损坏 ， 
显然 需要 较 长 的 时 间 进 行 恢复 ， 并 且 需 要 访问 大 量 的 日 志文 件 。 在 这 种 情况 下 ， 为 了 将 脱 机 
存储 介质 上 的 那 部 分 日 志文 件 读 到 联机 存储 介质 上 ， 等 竺 是 可 以 接受 的 。 

一 种 处 理 日 志文 件 脱 机 存储 的 方法 是 ， 将 联机 的 日 志文 件 分 成 两 个 独立 的 随机 访问 文 
件 。 日 志 记 录 被 写 人 第 一 个 文件 ， 直 到 到 达 某 个 上 限 国 值 ， 比 如 总 信息 量 的 70%。 然 后 ， 打 
开 第 二 个 文件 ， 新 事务 的 所 有 日 志 记录 都 被 写 人 该 文件 。 旧 的 事务 则 继续 使 用 第 一 个 文件 ， 
直到 这 些 事务 结束 ， 此 时 ， 第 一 个 文件 被 关闭 ， 并 写 到 脱 机 存储 介质 上 。 这 种 方法 简化 了 对 
单个 事务 恢复 的 处 理 ， 因 为 该 事务 的 所 有 日 志 记 录 要 么 都 在 联机 存储 介质 上 ， 要么 都 在 脱 机 
存储 介质 上 。 注 意 ， 日 志文 件 可 能 会 成 为 瓶颈 ， 写 日 志文 件 的 速度 对 于 整个 数据 库 系 统 的 性 
能 至 关 重 要 。 
检查 点 

-可 以 根据 日 志文 件 中 的 信息 ， 在 数据 库 发 生 故 障 时 进行 恢复 。 在 应 用 这 种 机 制 时 的 一 个 
难点 是 : 当 故 障 发 生 时 ， 我 们 不 知道 应 该 在 日 志文 件 中 向 前 搜索 多 远 才 可 以 不 用 重 做 那些 已 
经 安全 地 写 到 数据 库 的 事务 。 为 了 限制 搜索 的 范围 以 及 对 日 志文 件 进行 后 续 处 理 的 工作 量 ， 
我 们 采用 了 一 种 称 为 检查 点 (checkpointing) 的 技术 。 


检查 点 | 数据 库 与 事务 日 志文 件 之 间 的 同步 点 ， 在 该 点 上 所 有 的 缓冲 区 都 被 强制 写 到 二 级 
存储 器 。 


DBMS 在 预定 义 的 时 刻 设置 检查 点 ， 并 执行 以 下 操作 : 

e 将 内 存 中 的 所 有 日 志 记 录 写 到 二 级 存储 器 。 

© 将 数据 库 缓冲 区 中 所 有 被 修改 过 的 块 写 到 二 级 存储 器 。 

e 将 一 个 检查 点 记录 写 到 日 志文 件 。 该 记录 包含 所 有 在 检查 点 时 刻 活跃 事务 的 标识 符 。 

若 事 务 串 行 执 行 ， 则 当 故 障 发 生 时 ,检查 日 志文 件 ， 找 到 在 最 近 一 个 检查 点 前 启动 的 
最 后 一 个 事务 。 其 他 较 早 的 事务 应 该 均 已 提交 ， 并且 在 该 检查 点 时 刻 均 已 被 写 人 人 数据库。 因 
此 ， 需 要 重 做 的 事务 就 是 在 检查 点 时 刻 活跃 以 及 在 该 事务 之 后 启动 并 且 其 开始 和 提交 记录 都 
出 现在 日 志 中 的 那些 事务 。 如 果 当 故障 发 生 时 ， 一 个 事务 仍 处 于 活跃 状态 ， 则 该 事务 必须 被 
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撤销 。 如 果 事 务 并 发 执行 ， 那 么 应 该 重 做 所 有 在 最 近 检 查 点 以 后 提交 的 事务 ， 并且 撤销 所 有 
在 故障 发 生 时 仍 处 于 活跃 状态 的 事务 。 


| 例 22.12 >> 带 检查 点 的 UNDO/REDO 

在 例 22.11 中 ， 如 果 我 们 假设 在 时 刻 k 有 一 个 检查 点 ,那么 事务 T,、T; 所 做 的 修改 应 该 
已 经 被 写 信 二 级 存储 器 。 这 种 情况 下 ， 恢 复 管 理 器 就 不 会 重 做 事务 Ta, Too BE, KEEA 
句 必 须 重 做 事务 Ts ATs, AA Ts, Ts 是 在 检查 点 之 后 提交 的 。 恢 复 管 理 器 必须 撤销 事务 T, 
和 Ts， 因为 Ti、Te 在 故障 发 生 时 仍 处 于 活跃 状态 。 « 


总 而 言 之 ， 检 查 点 技术 是 一 种 相对 而 言 代 价 不 高 的 操作 ， 通 常 ， 在 一 个 小 时 之 内 可 以 设 
置 三 到 四 个 检查 点 。 这 样 ， 最 多 只 需要 恢复 15 ~ 20 分 钟 的 工作 。 


22.3.4 恢复 技术 


究竟 执行 哪 种 恢复 程序 ， 主 要 依赖 于 数据 库 受 损 的 程度 。 考 虑 以 下 两 种 情况 : 
© 如 果 数 据 库 遭 到 了 很 严重 的 损毁 ， 比 如 磁头 损坏 并 且 破 坏 了 数据 库 ， 则 除了 必须 利 
用 数据 库 最 近 的 副本 进行 恢复 以 外 ， 还 要 利用 日 志文 件 重 做 已 提交 事务 所 做 的 更 新 
操作 。 当 然 ， 前 提 是 日 志文 件 并 未 遭 到 破坏 。 在 第 19 章 中 提出 的 物理 数据 库 设计 方 
法 的 步骤 8 中 ， 推荐 尽 可 能 地 将 日 志文 件 和 主 数据 库 文件 分 别 存 储 在 独立 的 磁盘 上 。 
这 样 可 以 降低 数据 库 文件 与 日 志文 件 同 时 损坏 的 风险 。 
如 果 数 据 库 并 没有 受到 物理 损坏 ， 但 是 处 于 不 一 致 的 状态 ， 比 如 在 事务 执行 时 系统 
月 演 ， 则 必须 撤销 引发 不 一 致 的 修改 操作 。 可 能 还 有 必要 重 做 某 些 事 务 ， 以 确保 这 
些 事 务 所 做 的 更 新 操作 都 被 存储 到 二 级 存储 右 里 。 这 里 ， 无 需 使 用 数据 库 的 备份 副 
本 ， 只 需要 使 用 日 志文 件 中 的 前 像 和 后 像 就 可 以 将 数据 库 恢 复 到 一 致 的 状态 。 
针对 第 二 种 情况 〈 即 数据 库 未 被 破坏 ， 但 处 于 不 一 致 的 状态 ) 进行 恢复 的 技术 主要 有 两 
种 ， 分 别称 为 延迟 修改 (deferred update) 和 立即 修改 (immediate update)， 两 者 采用 不 同 
的 方式 将 修改 结果 写 入 二 级 存储 器 。 此 外 ， 我 们 还 将 简要 地 介绍 一 种 称 为 影像 页 (shadow 
paging) 的 技术 。 
采用 延迟 修改 的 恢复 技术 
采用 延迟 修改 恢复 协议 时 ， 直 到 事务 提交 以 后 ， 修 改 结果 才 会 被 写 到 数据 库 。 如 果 事 务 
在 提交 前 失败 ， 则 不 会 修改 数据 库 ， 因 此 ， 无 需 对 事务 的 修改 操作 执行 撤销 操作 。 然 而 ， 对 
已 提交 事务 的 修改 操作 则 有 必要 重 做 ， 因 为 这 些 修改 可 能 还 未 被 写 人 人 数据库。 在 这 种 情况 
下 ， 按 下 述 方式 可 利用 日 志文 件 恢复 系统 故障 ; 
o 当 事 务 启动 时 ， 将 事务 开始 (transaction start) 记录 写 人 日 志 。 
。 当 执 行 任何 一 个 写 操作 时 ， 先 写 日 志 记录 ， 该 记录 包括 所 有 以 前 说 过 的 日 志 数 据 
(除了 被 修改 数据 项 的 前 像 )。 此 时 并 没有 真正 将 修改 结果 写 入 数据库 缓冲 区 或 者 数 
据 库 。 
e 当 事 务 要 提交 时 ， 写 人 事务 提交 (transaction commit) 日 志 记 录 ， 先 将 该 事务 的 所 有 
日 志 记 录 写 到 磁盘 ， 然 后 提交 事务 。 根 据 日 志 记录 完成 对 数据 库 的 真正 更 新 。 
e 如 果 事 务 被 撤销 了 ， 则 忽略 该 事务 的 日 志 记 录 ， 不 执行 写 操 作 。 
和 注意， 延迟 修 改 恢复 协议 在 事务 真正 提交 之 前 将 日 志 记 录 写 到 磁盘 ， 因 此 ， 如 果 在 对 数 
据 库 进 行 真正 更 新 的 过 程 中 系统 发 生 故 障 ， 日 志 记 录 还 在 ， 没 有 被 破坏 ， 因 此 稍 后 还 可 以 再 
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对 数据 库 进 行 更 新 。 当 故障 发 生 时 ， 需 要 检查 日 志文 件 ， 找 到 故障 发 生 时 正在 执行 的 所 有 事 
务 。 从 日 志文 件 的 最 后 一 项 开始 ， 回 湖 到 最 近 的 一 个 检查 点 记录 
e 重 做 所 有 出 现 了 事务 开始 (transaction start) 和 事务 提交 (transaction commit) 日 志 
记录 的 事务 。 重 做 过 程 是 依据 事务 的 后 像 日 志 记 录 执 行 所 有 的 数据 库 写 操作 ， 并 且 
按照 这 些 记录 写 入 日 志 的 顺序 执行 。 如 果 在 故障 发 生前 这 个 写 操作 已 经 执行 过 ， 下 
做 一 次 写 操作 也 没有 什么 危害 〈 即 这 个 操作 是 壤 等 的 )。 这 种 方法 保证 了 我 们 一 定 会 
更 新 所 有 在 故障 发 生前 没有 被 正确 更 新 的 数据 项 。 

o 对 所 有 出 现 了 事务 开始 和 事务 撤销 (transaction abort) 日 志 记 录 的 事务 ， 不 执行 任何 

操作 ， 因 为 这 些 事 务 并 没有 对 数据 库 执 行 真正 的 写 操 作 ， 所 以 也 不 必 撤 销 。 

如 果 在 恢复 过 程 中 发 生 了 第 二 次 系统 崩 演 ， 则 可 以 再 次 利用 日 志 记 录 来 恢复 数据 库 。 写 
日 志 记 录 的 方式 决定 了 不 管 重 做 多 少 次 这 些 写 操作 ， 结 果 都 是 一 样 的 。 
采用 立即 修改 的 恢复 技术 

采用 立即 修改 恢复 协议 时 ， 更 新 一 旦 发 生 就 被 立即 施加 到 数据 库 ， 而 无 需 等 到 提交 时 
刻 。 正 像 发 生 故 障 后 不 得 不 重 做 已 经 提交 事务 所 做 的 更 新 一 样 ， 现 在 需要 的 是 撤销 故障 
发 生 时 刻 仍 未 提交 的 事务 的 影响 。 在 这 种 情况 下 ， 按 下 述 方式 可 利用 日 志文 件 恢 复 系 统 
故障 : 

当 事 务 启 动 时 ， 向 日 志 写 人 事务 开始 记录 。 

当 执行 任何 一 个 写 操作 时 ， 回 日 志文 件 中 写 人 一 条 包含 必要 数据 的 记录 。 
一 旦 写 日 志 记 录 完 成 ， 立 刻 将 修改 结果 写 入 数据 库 缓冲 区 。 

对 数据 库 的 更 新 在 下 一 次 将 缓冲 区 的 内 容 刷 新 到 二 级 存储 器 时 进行 。 

当 事 务 提交 时 ， 向 日 志 写 人 事务 提交 记录 。 

在 事务 的 操作 结果 被 写 入 数据 库 之 前 就 先 将 日 志 记 录 (至 少 是 部 分 日 志 记 录 ) 写 人 数据 
库 是 非常 必要 的 ， 这 被 称 为 先 写 日 志 协 议 ( write-ahead log protocol)。 如 果 先 将 修改 结果 写 
和 数据库， 那么 一 旦 在 写 日 志 记 录 之 前 发 生 了 故障 ， 恢 复 管理 器 是 无 法 撤销 (或 者 重 做 ) 这 
些 操作 的 。 根 据 先 写 上 日志 协议 ， 恢 复 管 理 器 可 以 大 胆 假设 ， 如 果 在 日 志文 件 中 不 存在 某 个 事 
务 的 事务 提交 记录 ， 则 该 事务 在 故障 发 生 时 必然 仍 处 于 活跃 状态 ， 因 此 必须 被 撤销 。 

如 果 事 务 被 撤销 (absort)， 则 可 以 利用 日 志 进 行 撤 销 (undo)， 因 为 日 志 中 包含 了 所 有 被 
更 新 字段 修改 前 的 值 。 由 于 一 个 事务 可 能 对 一 个 数据 项 进行 多 次 修改 ， 则 对 写 操作 的 撤销 要 
按 相 反 的 顺序 进行 。 无 论 事务 的 写 操作 是 否 已 经 被 施加 到 数据 库 本 身 ， 写 人 数据 项 的 前 像 能 
够 保证 数据 库 被 恢复 到 该 事务 开始 前 的 状态 。 

如 果 系 统 发 生 了 故障 ， 利 用 日 志 对 事务 进行 撤销 或 者 重 做 的 恢复 包括 : 

e 对 于 任何 事务 ， 若 其 事务 开始 和 事务 提交 记录 都 出 现在 日 志 中 ， 则 根据 日 志 记 录 重 

做 ， 将 被 更 新 字段 的 后 像 写 信人 数据库， 如 前 所 述 。 注 意 ， 如 果 后 像 已 经 被 写 人 了 数 
据 库 ， 重 做 时 的 再 次 写 虽 然 没 有 必要 ， 但 也 不 会 对 数据 库 造 成 任何 不 良 影响 。 然 而 ， 
这 种 操作 使 得 那些 实际 上 还 未 将 修改 结果 写 人 数据 库 的 写 操作 此 时 得 到 了 真正 的 
执行 。 

o 对 于 任何 事务 ， 若 日 志 中 仅 包 含 了 该 事务 的 事务 开始 记录 而 没有 事务 提交 记录 ， 则 

必须 撤销 。 这 时 ， 要 利用 日 志 记 录 写 人 被 影响 字段 的 前 像 ， 从 而 将 数据 库 恢 复 到 该 
事务 开始 前 的 状态 。 撤 销 操 作 要 按照 它们 被 写 入 日 志文 件 的 相反 的 顺序 进行 。 
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影像 页 技术 

除了 基于 日 志 的 恢复 技术 以 外 ， 还 有 一 种 我 们 前 面 曾 提 到 过 的 恢复 技术 一 一 影像 页 
( shadow paging) 技术 (Lorie，1977 )。 影 像 页 技术 在 事务 的 生存 期 中 为 其 维持 了 两 张 页 表 : 
当前 页 表 和 影像 页 表 。 当 事务 刚 启 动 时 ， 两 张 页 表 是 相同 的 。 此 后 ， 影 像 页 表 不 再 改变 ， 并 
在 系统 故障 时 用 于 恢复 数据 库 。 在 事务 执行 的 过 程 中 ， 当 前 页 表 用 于 记录 对 数据 库 的 所 有 更 
新 。 当 事务 完成 时 ， 当 前 页 表 转 变 为 影像 页 表 。 与 基于 日 志 的 方法 相 比 ， 影 像 页 技术 有 许多 
优点 : 没有 维持 日 志文 件 的 开销 ， 而 且 由 于 无 需 撤销 或 者 重 做 ,恢复 起 来 也 相当 快速 。 然 
而 ， 它 也 有 缺点 ， 比 如 数据 分 裂 以 及 需要 周期 性 地 进行 无 用 单元 回收 ， 以 回收 那些 不 再 被 访 
问 的 块 。 


22.3.5 “分 布 式 DBMS 的 恢复 


在 第 24 章 和 第 25 章 ， 我 们 将 讨论 分 布 式 DBMS (Distributed DBMS, DDBMS), DDBMS 
由 逻辑 上 相关 物理 上 却 分 布 于 计算 机 网 络 中 的 多 个 数据 库 组 成 ， 每 一 个 数据 库 都 是 由 本 地 
DBMS 控制 的 。 在 DDBMS 中 ， 分 布 式 事务 (访问 多 个 节点 的 数据 的 事务 ) 可 以 被 划分 为 多 个 
子 事务 ， 每 一 个 子 事务 负责 访问 一 个 节点 的 数据 。 在 这 样 的 系统 里 ， 既 需要 维护 子 事务 的 原 
子 性 ， 也 需要 维护 整体 (全 局 ) 事务 的 原子 性 。 上 述 技术 可 以 用 于 保证 子 事务 的 原子 性 。 保 证 全 
局 事务 的 原子 性 则 意味 着 保证 子 事务 要 么 都 提交 ， 要 么 都 被 撤销 。 在 DDBMS 中 比较 常用 的 两 
种 恢复 协议 是 两 阶段 提交 (2PC) 和 三 阶段 提交 (3PC)， 我 们 将 在 25.4 节 详 细 讨 论 这 两 种 协议 。 
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到 现在 为 止 ， 本 章 讨 论 的 所 有 事务 协议 都 适用 于 传统 商业 应 用 领域 的 事务 类 型 ， 比 如 银 
行 系 统 和 航空 订 票 系统 。 这 些 应 用 有 如 下 特征 : i 

e 数据 类 型 简单 ， 比 如 只 要 求 整 型 、 十 进 制 数 字 类 型 、 短 字符 串 、 日 期 型 。 

© 事务 的 生存 期 短 ， 通 币 不 是 在 数秒 之 内 就 是 在 数 分 钟 之 内 结束 。 

在 9.1 节 我 们 分 析 了 已 经 出 现 的 一 些 更 高 级 的 数据 库 应 用 。 例 如 在 设计 领域 的 应 用 ， 包 

括 计算 机 辅助 设计 、 计 算 机 辅助 制造 和 计算 机 辅助 软件 工程 等 ， 它 们 具有 以 下 不 同 于 传统 数 
据 库 应 用 的 特点 : 

。 设计 可 能 非常 庞大 ， 可 能 由 上 百 万 个 部 分 组 成 ， 其 中 包含 许多 相互 关联 的 子 系统 设计 。 

e 设计 不 是 静止 不 变 的 ， 而 是 随 着 时 间 的 推移 而 演变 。 当 设计 被 修改 时 ， 必 须 将 修改 
传播 到 所 有 相关 的 对 象 中 。 设 计 本 身 动 态 变化 的 特性 可 能 意味 着 某 些 行为 是 无 法 预 
见 的 。 

o 由 于 拓扑 联系 、 功 能 上 的 联系 以 及 容错 等 原因 ， 使 得 设计 上 的 更 新 可 能 波及 很 大 范 
围 ， 一 次 修改 可 能 会 影响 大 量 的 设计 对 象 。 

。 通常 ， 每 个 组 件 都 有 多 种 设计 方案 可 供 考虑 ， 而 且 必 须 保留 每 个 部 件 的 正确 版 本 。 
这 就 涉及 要 以 茶 种 形式 进行 版 本 控制 和 配置 管理 。 

e 可 能 有 几 百 人 参与 设计 ， 并 且 他 们 可 能 在 该 大 型 设计 的 多 个 版 本 上 并 行 地 开展 工作 。 
即便 如 此 ， 最 后 的 结果 也 必须 保持 一 致 性 与 协调 性 。 这 有 时 候 也 被 称 为 协同 工程 。 
协同 合作 要 求 在 并 发 活动 之 间 实 现 交 互 和 共享 。 

上 述 一 些 特点 使 得 事务 变 得 很 复杂 ， 要 访问 许多 数据 项 ， 生 存 期 长 达 几 个 小 时 、 几 天 其 

至 几 个 月 。 这 些 特 点 要 求 我 们 重新 审视 传统 事务 的 管理 协议 ， 以 解决 下 列 问题 : 
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e S RAIN WAR, HBS (long-duration transaction) 更 容易 发 生 故 障 。 对 这 类 事 
务 的 撤销 是 令 人 难以 接受 的 ， 因 为 这 会 浪费 大 量 已 经 完成 的 工作 。 因 此 ， 为 了 使 工 
作 量 的 损耗 最 小 ， 我 们 要 求 事务 能 够 被 恢复 到 故障 发 生前 不 久 的 某 个 状态 。 

e 再 次 考虑 时 间 因 素 ， 长 寿 事务 可 能 会 (例如 加 锁 ) 访问 大 量 的 数据 项 。 为 了 保持 事务 
的 隅 离 性 ， 一 直 要 等 到 该 事务 提交 后 ， 这 些 数 据 项 才能 被 其 他 应 用 程序 访问 。 如 果 
在 很 长 一 段 时 间 之 内 数据 都 不 能 被 访问 ， 则 会 限制 并 发 性 ， 这 是 人 们 所 不 期 望 的 。 

o 如 果 使 用 的 是 基于 加 锁 的 协议 ， 那 么 事务 运行 的 时 间 越 长 ， 发 生死 锁 的 可 能 性 就 越 
Ko 已 经 证 明 ， 死 锁 发 生 的 频率 与 事务 大 小 的 四 次 方 成 正比 (Gray，1981 ) 。 

e 一 种 能 使 人 们 之 间 协 同 合作 的 方法 是 使 用 共享 数据 项 。 但 是 ， 由 于 传统 的 事务 管理 
协议 要 求 未 完成 的 事务 之 间 相 互 隅 离 ， 所 以 就 严格 限制 了 这 种 类 型 的 协同 合作 。 

在 下 面 的 小 节 里 ， 我 们 将 讨论 下 列 高 级 事务 模型 : 

e KES IRN 

Saga 

多 级 事务 模型 

动态 重 构 

工作 流 模 型 


224.1 藤 套 事务 模型 


伐 套 事务 模型 | 事务 被 看 成 一 组 相互 关联 的 子 任务 或 者 子 事务 ， 每 个 子 任 务 或 子 事务 又 可 
以 包含 任意 多 个 子 事务 。 


HES SW (nested transaction model) 是 由 Moss (1981) EHK, ERER IANH, 
完整 的 事务 构成 了 一 棵 子 事务 (subtransaction) 树 ， 或 者 子 事务 层次 。 子 事务 树 有 一 个 顶层 事 
务 ， 顶 层 事 务 又 有 许多 子 事务 ， 每 个 子 事务 又 可 以 包含 散 套 事务 。 在 Moss 的 最 初 设想 中 ， 只 
允许 叶子 级 的 子 事务 (位 于 骨 套 的 最 底层 的 子 事务 ) 执行 数据 库 操 作 。 例 如 ， 在 图 22-26 中 ， 
有 一 个 预订 事务 (T), T 又 由 预订 航班 (T )、 酒 店 (Ts) 和 租车 (Te ) 事务 组 成 。 航 班 预订 
事务 本 身 又 被 分 成 两 个 子 事务 : 一 个 预订 从 伦敦 到 巴黎 的 航班 《Ts )， 另 一 个 预订 从 巴黎 到 纽 
约 的 航班 ( Ts )。 事 务 只 能 自 下 而 上 地 提交 。 因 此 ，T3 AT, 必须 在 父 事务 Tr 之 前 提交 ， 而 并 
必须 在 其 父 事 务 T 之 前 提交 。 但 是 ， 某 层 事务 的 撤销 不 应 该 影响 高 层 事务 的 执行 。 而 父 事务 
则 可 以 按 如 下 方式 进行 恢复 : 
e 重 试 子 事务 。 
e 当 子 事务 确实 不 太 重 要 时 ， 可 以 忽略 失败 的 子 事务 。 在 本 例 中 ， 汽 车 租赁 可 被 看 成 
可 有 可 无 的 ， 因 此 总 的 预订 事务 在 没有 该 子 事务 的 情况 下 照样 可 以 继续 进行 。 

e 子 事务 失败 时 ， 可 以 执行 一 个 被 称 为 应 急 子 事务 (contingency subtransaction) 的 蔡 
代 子 事务 。 在 本 例 中 ， 如 果 预 定 Hilton 饭店 的 子 事务 失败 了 ， 则 可 以 尝试 预订 另外 
一 个 饭店 ， 比 如 Sheraton。 

e 撤销 。 

位 于 中 间 层 的 子 事务 提交 以 后 ， 其 所 做 的 更 新 只 对 它们 的 直接 父 事务 可 见 。 因 此 ， 当 
T: 提交 时 ，Ts 所 做 的 修改 只 为 T; 所 见 ， 而 对 Ti 或 Ti 以 外 的 任何 事务 均 不 可 见 。 此 外 ， 子 
事务 的 提交 还 受 限 于 其 上 层 事务 的 提交 或 撤销 。 在 髓 套 事务 模型 里 ， 高 层 事务 均 遵 循 扁平 事 
务 (flat transaction) 的 传统 ACID 特性 。 
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begin_transaction T} Complete Reservation 
begin_transaction T, Airline_reservation 
begin_transaction T, First_flight 
reserve_airline_seat(London, Paris); 
commit T3; 


begin_transaction T4 Connecting_flight 


reserve_airline_seat(Paris, New York); 

commit T4; 

commit T»; 

begin_transaction Ts Hotel_reservation 
book_hotel(Hilton); 

commit Ts; 

begin_transaction T¢ Car_reservation 
book_car(); 


commit Tg; 





commit T}; 


图 22-26 WEES 


基于 严格 两 段 锁 协 议 ，Moss 还 提出 了 一 个 用 于 藤 套 事务 的 并 发 控制 协议 。 子 事务 的 执 
行 相 对 独立 ， 仿 佛 与 其 父 事 务 没有 什么 关联 。 知 子 事务 请 求 对 某 数据 项 加 锁 ， 而 持 有 冲突 锁 
的 事务 就 是 该 子 事务 的 父 事务 ， 则 该 加 锁 请 求 被 允许 。 当 子 事务 提交 时 ， 它 所 拥有 的 锁 被 其 
父 事 务 继承 。 在 继承 锁 时 ， 如 果 父 子 事务 都 持 有 同一 个 数据 项 的 锁 ， 则 父 事务 以 一 种 更 加 互 
斥 的 模式 持 有 该 锁 。 
He ERR AY ERATE FE FF : 
o 模块 化 。 为 了 更 好 地 实现 并 发 和 恢复 ,一 个 事务 可 以 被 分 解 为 多 个 子 事务 。 
© 在 更 细 粒 度 的 级 别 上 进行 并 发 控制 和 恢复 。 并 发 控制 和 恢复 是 在 子 事 务 级 而 不 是 事 
务 级 上 进行 。 

© 事务 内 部 的 并 行 性 。 子 事务 可 以 并 发 执行 。 

© 事务 内 部 的 可 恢复 性 。 未 提交 的 子 事务 可 以 在 不 影响 其 他 子 事务 的 情况 下 被 撤销 或 
者 回 滚 。 


利用 保存 点 模拟 嵌 套 事务 


保存 点 | 平板 事务 中 表示 一 个 部 分 一 致 状态 的 可 标识 点 。 随 后 一 旦 出 现 问 题 ， 可 将 保存 点 
作为 事务 内 部 的 重启 点 。 


铅 套 事务 模型 的 目标 之 一 是 提供 一 种 比 事务 这 一 粒度 级 别 更 细 的 恢复 单位 。 在 事务 的 执 
行 过 程 中 ， 用 户 可 以 调用 SAVE WORK 语句 建立 一 个 保存 点 ( savepoint)。 于 是 就 会 产生 一 
个 标识 符 ， 在 后 面 用 户 执行 ROLLBACK WORK<savepoint identifier> 语句 9S 进行 回 深 时 ， 
就 可 以 将 事务 回 滚 到 该 保存 点 。 然 而 ， 与 舱 套 事务 不 同 的 是 ,保存 点 不 支持 任何 形式 的 事务 
内 部 并 行 。 


22.4.2 Saga 
| Saga | 一 系列 可 以 相互 重 登 执行 的 (平板 ) FF, 


O ”这 不 是 标准 的 SQL 语句 ， 仅 仅 用 作 举 例 说 明 。 
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Saga 这 一 概念 是 由 Garcia-Molina 和 Salem ( 1987) 基于 补偿 事务 提出 来 的 。DBMS 保 
证 要 么 Saga 中 所 有 的 事务 都 成 功 提交 ， 要 么 就 执行 补偿 事务 对 部 分 已 执行 事务 进行 恢复 。 
SHREDS TAHE, MEBSMURELRS Je, M Saga 只 能 舱 套 一 层 。 而 且 ， 针 对 每 
一 个 子 事务 都 存在 一 个 补偿 事务 ， 该 补偿 事务 能 够 从 语义 上 撤销 该 子 事务 的 影响 。 因 此 ， 寿 
有 一 个 包含 n 个 事务 Noe T2, pre T, 的 Saga, 相应 的 补偿 事务 是 Cr C2, ey an Cy; 则 Saga 
最 终 的 执行 序列 可 能 为 : 

Ty TH te Ea 如 果 事 务 成 功 完成 

要 如 果子 事务 T; 失败 且 被 撤销 

例如 ， 在 前 面 讨论 的 预订 系统 中 ， 为 了 产生 一 个 Saga， 我 们 对 事务 进行 了 重 构 ， 去 除 
了 其 中 髋 套 的 航班 预订 ， 如 下 所 示 : 

Ts, Tas Ts, Te 

这 些 子 事务 表示 图 22-26 中 顶层 事务 的 叶 节 点 。 可 以 很 容易 地 推导 出 撤销 两 次 航班 预 
订 、 酒 店 预订 以 及 汽车 租赁 预订 的 补偿 事务 。 

与 扁平 事务 模型 相 比 ，Saga 放宽 了 对 隔离 性 的 要 求 : 在 Saga 完成 前 ， 人 允许 Saga 将 其 
部 分 结果 透露 给 其 他 并 发 执行 的 事务 。 当 子 事务 相对 独立 并 且 具 有 补偿 事务 时 ，Saga 通 
常 比较 有 有 用， 预订 系统 就 属于 这 种 情况 。 然 而 在 某 些 情况 下 ， 很 难 预先 对 补偿 事务 做 出 定 
XL, DBMS 可 能 有 必要 和 用 户 交 互 以 确定 正确 的 补偿 效应 。 在 男 一 些 情况 下 ， 可 能 根本 
无 法 定义 补偿 事务 ， 比 如 ， 对 于 一 个 从 自动 取款 机 取 走 现金 的 事务 ， 就 无 法 为 其 构造 补偿 
事务 。 


22.4.3 ”多 级 事务 模型 


22.4.1 节 的 侍 套 事务 模型 要 求 提 交 过 程 按 自 下 而 上 直至 顶层 事务 的 方式 进行 。 更 准确 地 
说 ， 这 被 称 为 封闭 式 嵌 套 事务 ( closed nested transaction)， 因 为 这 些 事务 的 语义 强制 了 顶层 
的 原子 性 。 与 之 相反 的 是 开放 式 栓 套 事务 ( open nested transaction), FARRER S MIE T 
这 个 条 件 ， 并 且 人 允许 子 事务 的 部 分 结果 可 以 为 外 部 事务 所 见 。 上 节 讨 论 的 Saga 模型 就 是 开 
放 式 髓 套 事务 的 一 个 例子 。 

开放 式 艇 套 事 务 的 一 个 特例 是 多 级 事务 (multilevel transaction) 模型 ， 多 级 事务 模型 的 
子 事务 树 是 平衡 的 (Weikum，1991 ; Weikum and Schek，1991 )。 树 中 相同 深度 的 节点 代表 
了 DBMS 中 相同 抽象 级 别 上 的 操作 。 树 中 的 边 则 表示 某 一 操作 是 由 其 直接 下 层 的 一 系列 操 
作 实 现 的 。n 级 事务 的 各 级 分 别 被 标识 为 Lo，，Li，…，L,， 其 中 Lo 代表 树 的 最 低 一 级 ，L， 
代表 树 的 根 。 传 统 的 扁平 事务 保证 在 最 低级 (Lo ) 没有 冲突 。 然 而 ， 多 级 事务 模型 的 基本 思 
HE: A L; 级 有 两 个 操作 ，L; 级 的 下 一 层 是 Li 级 ，Li 级 为 这 两 个 操作 的 具体 实现 ， 则 即 
使 Li 级 出 现 了 冲突 ，L 级 也 可 能 不 会 冲突 。 多 级 事务 模型 具有 冲突 信息 仅 与 特定 层 相 关 的 
优点 ， 因 此 与 传统 的 扁平 事务 相 比 ， 多 级 事务 可 文 持 更 高 的 并 发 度 。 

比如 ， 考 虑 图 22-27 所 示 的 包含 两 个 事务 T; 和 Ts 的 调度 。 可 以 很 容易 地 证 明 这 个 调度 
不 是 冲突 可 串 行 化 的 。 然 而 ， 考 虑 将 T; 和 Ts 分 成 以 下 在 较 高 级 别 操作 的 子 事务 : 

T7: T7zi， 将 bal. 加 5 Ts: Tai, + bal, 加 10 

Tr, A bal, P 5 Teo, A bals 中 减 2 

根据 这 些 操 作 的 语义 ， 由 于 加 法 和 减法 是 可 交换 的 ， 因 此 可 以 任意 顺序 执行 这 些 子 事 

务 ， 且 总 是 能 产生 正确 结果 。 
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T; 


begin_transaction 
read(bal,) 
bal, = bal, +5 
write(bal,) 
begin_transaction 
read(bal, ) 
bal, = bal, + 10 


write(baly) 


read(bal, ) 
bal, = bal, — 5 
write(baly ) 
commit 
read(bal,) 
bal, = bal, — 2 
write(bal,) 


commit 
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22.4.4 动态 重 构 


在 本 节 的 开始 介绍 了 设计 类 应 用 程序 的 某 些 特 征 ， 比 如 生存 期 的 不 确定 性 (从 数 小 时 到 数 
月 )、 需 与 并 发 的 活动 交互 、 开 发 进度 不 确定 ， 因 此 ， 某 些 活动 无 法 一 开始 就 做 出 预测 。 为 了 
解决 由 扁平 事务 的 ACID 特性 对 这 些 应 用 的 约束 问题 ， 人 们 提出 了 两 种 新 的 操作 : 拆 分 事务 
(split-transaction) 和 合并 事务 (join-transaction)(Pu et al.，1988 ) 。 拆 分 事务 的 基本 做 法 是 将 一 
个 活跃 事务 拆 分 成 两 个 可 串 行 的 事务 ， 同 时 在 两 个 新 事务 之 间 对 操作 和 资源 (比如 ， 加 锁 的 数 
据 项 ) 进行 分 割 。 分 割 之 后 ， 新 事务 被 独立 执行 ， 也 许 还 分 别 被 不 同 的 用 户 控制 ， 似 乎 它们 从 
来 就 是 相互 独立 的 一 样 。 这 就 使 得 事务 在 保持 语义 不 变 的 同时 ， 还 允许 其 他 事务 与 其 共享 部 
分 结果 ， 也 就 是 说 ， 如 果 原 事务 是 遵循 ACID 特性 的 ， 那 么 新 事务 也 会 遵循 ACID 特性 。 
只 有 当 生 成 的 两 个 事务 互相 是 可 串 行 的 并 且 与 其 他 所 有 并 发 执行 事务 均 可 串 行 时 ， 拆 分 
事务 的 操作 才能 执行 。 事 务 T 可 以 被 拆 分 为 事务 A 和 B 的 条 件 是 : 
(1) AWriteSetmBWriteSetCBwriteLast， 也 就 是 说 被 A 写 的 数据 项 集 (AWriteSet) 与 被 
B 写 的 数据 项 集 ( BWriteSet) 的 交集 应 该 包含 于 被 B 最 后 写 的 数据 项 集 ( BwriteLast) 
中 。 条 件 1 说 明 如 果 A 和 B 都 写 同一 个 对 象 ， 那 么 B 的 写 操作 必须 在 A 的 写 操作 之 
后 执行 。 
(2) AReadSetNBWriteSet=O, tH PEER A 读 的 数据 项 集 (AReadSet) AK BSH 
数据 项 集 应 该 没有 交集 。 条 件 2 说 明 A 不 能 看 到 B 的 任何 修改 结果 。 
(3 ) BReadSetmAWriteSet 王 ShareSet， 也 就 是 说 被 B 读 的 数据 项 集 ( BReadSet) 与 被 A 
写 的 数据 项 集 可 以 不 为 空 ， 而 等 于 某 一 数据 项 的 集合 (ShareSet)。 条 件 3 说 明 B 可 
以 看 到 A 的 修改 结果 。 
这 三 个 条 件 保 证 了 在 可 串 行 化 的 调度 中 ,A 在 B 之 前 。 但 是 ， 如 果 A 被 撤销 ， 那么 B 
也 必须 被 撤销 ， 因 为 它 读 了 由 A 写 的 数据 。 如 果 BWriteLast 和 ShareSet 均 为 空 ， 则 A AB 
可 以 任意 顺序 被 串 行 化 ， 并 且 可 以 独立 提交 。 
合并 事务 是 拆 分 事务 的 逆 操 作 。 合 并 事务 将 正在 执行 的 两 个 或 多 个 相互 独立 的 事务 的 操 
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作 合 并 ， 就 好 像 这 些 事务 一 直 就 是 一 个 事务 似 的 。 在 拆 分 事务 之 后 ， 紧 接着 又 将 新 创建 的 事 
务 合 并 ， 这 种 方法 可 被 用 于 在 某 些 事务 之 间 传 递 资源 ， 使 得 这 些 资源 在 此 期 间 对 其 他 事务 不 
可 用 。 
动态 重 构 方 法 的 优点 主要 有 : 
© 自 适应 性 恢复 ， 人 允许 事务 提交 部 分 操作 结果 ， 因 此 这 些 已 经 提交 的 结果 就 不 会 受到 
以 后 发 生 的 故障 的 影响 。 
© 放松 了 对 隔离 性 的 要 求 ， 使 得 资源 在 部 分 事务 提交 时 就 被 释放 。 


22.4.5 ”工作 流 模型 


迄今 为 止 ， 本 节 讨 论 的 模型 都 是 为 了 解决 长 寿 事务 无 法 适应 扁平 事务 的 特性 约束 而 提出 
的 。 然 而 ， 有 人 认为 ， 这 些 模型 仍 不 足以 有 力 地 刻画 商业 活动 。 人 们 将 开放 和 骸 套 事务 相 结 
合 ， 提 出 了 更 复杂 的 模型 。 但 是 ， 由 于 这 些 模型 基本 上 不 遵循 任何 ACID 特性 ， 因 此 使 用 工 
作 流 模型 这 个 名 字 来 指 代 它 们 更 贴切 。 
作为 一 种 活动 ， 工 作 流 涉及 由 不 同 处 理 实体 执行 的 多 个 任务 之 间 的 协调 运行 。 处 理 实体 
可 以 是 人 也 可 以 是 软件 系统 ， 例 如 DBMS 、 应 用 程序 或 者 电子 邮件 系统 。DreamHome 案例 
研究 的 一 个 实例 就 是 关于 房产 的 租用 许可 的 处 理 过 程 。 想 要 租 住 某 房产 的 客户 与 负责 管理 该 
房产 的 员工 联络 ,该 员工 再 与 公司 的 信誉 管理 员 联 系 ， 而 信誉 管理 员 又 要 利用 类 似 信 誉 检查 
机 构 的 资源 来 判定 是 否 接 受 该 客户 。 然 后 仍 由 信誉 管理 员 决 定 是 接受 还 是 拒绝 该 项 业务 ， 并 
将 最 终结 果 告 知 该 员工 ， 员 工 再 把 结果 通知 客户 。 
在 工作 流 系统 中 ， 通 常 涉 及 两 个 问题 : 工作 流 的 说 明 以 及 工作 流 的 执行 。 事 实 上 ， 由 于 
许多 企业 都 是 用 多 个 独立 控制 的 系统 自动 处 理 业 务 流程 的 不 同 部 分 ， 因 此 这 两 个 问题 变 得 比 
较 复杂 。 下 列 是 定义 工作 流 时 的 关键 问题 (Rusinkiewicz and Sheth, 1995 ): 
© 任务 说 明 。 通 过 定义 一 组 对 外 可 见 的 执行 状态 以 及 状态 间 的 迁移 ， 来 定义 每 个 任务 
的 执行 结构 。 

© 任务 协调 一 致 的 需求 。 这 种 需求 通常 被 描述 为 任务 间 的 执行 相关 性 和 数据 流 相 关 性 ， 
也 就 是 工作 流 的 结束 条 件 。 

o 执行 (正确 性 ) 需求 。 限 制 工作 流 的 执行 必须 满足 应 用 程序 指定 的 正确 性 标准 ， 包 括 
对 故障 和 执行 原子 性 的 要 求 以 及 工作 流 并 发 控制 和 恢复 要 求 。 

从 执行 角度 而 言 ， 一 个 活动 具有 开放 的 咀 套 语义 ， 即 活动 允许 部 分 结果 在 其 边界 外 可 
见 ， 也 人 允许 活动 的 组 件 独立 提交 。 活 动 的 组 件 可 以 是 具有 开放 艇 套 语义 的 活动 ， 或 者 是 只 有 
在 提交 时 其 结果 才 对 整个 系统 可 见 的 封闭 的 艇 套 事务 。 而 封闭 的 拱 套 事务 只 能 由 其 他 封闭 的 
丛 套 事务 组 成 。 活 动 的 部 分 组 件 被 定义 为 关键 组 件 ， 当 关键 组 件 被 撤销 时 ， 则 其 父 事务 也 必 
须 被 撤销 。 另 外 ， 如 前 所 述 ， 还 可 以 定义 补偿 事务 和 应 急 子 事务 。 

对 高 级 事务 模型 更 深入 的 讨论 ， 感 兴趣 的 读者 可 参考 Korth et al. (1988), Skarra and 
Zdonik ( 1989 )、 Khoshafian and Abnous ( 1990 ), Barghouti and Kaiser ( 1991 ) 和 Gray and 
Reuter ( 1993 ) 。 


22.5 Oracle 中 的 并 发 控制 与 恢复 


为 了 使 本 章 更 加 完整 ， 我 们 简要 地 分 析 一 下 Oraclellg 中 的 并 发 控制 和 恢复 机 制 。Oracle 
处 理 并 发 访问 的 方法 与 22.2 节 中 描述 的 协议 稍 有 差别 。Oracle 使 用 的 是 多 版 本 读 一 致 性 协议 ， 
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该 协议 保证 用 户 查 询 访问 数据 时 ， 能 看 到 所 查询 数据 的 一 个 一 致 的 视图 (Oracle Corporation, 
2011a)。 即 使 另外 一 个 用 户 在 查询 期 间 修 改 了 基础 数据 , Oracle 也 将 维护 该 数据 的 一 个 版 本 ， 
保持 其 在 查询 开始 之 初 的 状态 。 如 果 在 查询 开始 时 还 有 其 他 的 未 提交 事务 在 执行 ，Oracle 保 
证 查询 事务 不 会 看 到 这 些 未 提交 事务 的 修改 结果 。 男 外 ，Oracle 从 不 对 读 操作 涉及 的 数据 加 
锁 ， 这 意味 着 读 操作 从 不 阻塞 写 操 作 的 执行 。 我 们 将 在 后 面 的 部 分 着 重 讨论 这 些 概 念 。 接 下 
来 将 使 用 DBMS 这 个 术语 ， 即 在 Oracle 中 ， 关 系 是 由 行 、 列 构成 的 表 。 附 录 H.2 对 Oracle 进 
行 了 简介 。 


22.5.1 Oracle 的 隔离 级 别 


在 7.5 节 中 ,我 们 已 经 讨论 过 隔离 级 别 的 概念 ， 隔离 级 别 描 述 了 事务 是 如 何 相互 隔离 
的 。Oracle 实现 了 ISO SQL 标准 定义 的 四 个 隔离 级 别 中 的 两 个 ， 即 READ COMMITTED( 读 
已 提交 ) 和 SERIALIZABLE (可 串 行 化 ): 

èe READ COMMITTED: 语句 级 强制 串 行 化 (这 是 Oracle 默认 的 隔离 级 别 )。 在 这 一 隔 

离 级 别 ， 事 务 中 的 每 一 条 语句 都 只 能 看 到 该 语句 (而 不 是 事务 ) 开始 之 前 被 提交 的 数 
据 。 这 就 意味 着 在 执行 同一 事务 的 两 条 相同 的 读 语句 之 间 ， 数 据 可 以 被 其 他 事务 修 
改 ， 即 允许 出 现 不 可 重读 和 幻 读 。 

è SERIALIZABLE : 事务 级 强制 串 行 化 。 事 务 中 的 每 条 语句 都 只 能 看 见 在 本 事务 开始 之 

前 被 提交 的 数据 ， 以 及 本 事务 通过 INSERT, UPDATE 或 DELETE 语句 修改 的 结果 。 

这 两 种 隔离 级 别 都 使 用 行 级 锁 ， 并 且 知 事务 企图 修改 一 行 数据 ， 而 该 行 被 某 未 提交 事务 更 
新 过 ， 那 么 事务 只 能 等 待 。 如 果 阻 塞 的 事务 被 撤销 并 且 回 滚 其 修改 ， 那 么 等 待 的 事务 可 以 开始 
更 新 先前 被 加 锁 的 行 。 如 果 阻 塞 的 事务 提交 并 且 释 放 了 锁 ， 车 采用 的 是 READ COMMITTED 
模式 ， 则 等 待 的 事务 可 以 开始 执行 更 新 操作 ; 然而 ,车 采用 的 是 SERIALIZABLE 模式 ， 则 
返回 一 个 错误 信息 ， 表 明 这 些 操 作 不 可 串 行 化 。 在 这 种 情况 下 ， 应 用 程序 开发 人 员 必 须 在 程 
序 中 加 入 网 辑 控制 ， 使 得 程序 返回 事务 的 起 点 并 重启 。 

另外 ，Oracle 还 支持 第 三 种 隔离 级 别 : 

e。 READONLY: 只 读 事务 只 能 看 到 在 本 事务 开始 前 提交 的 数据 。 

在 Oracle 中 , 用 SQL SET TRANSACTION 或 者 ALTER SESSION 命令 设置 隔离 级 别 。 


22.5.2 ”多 版 本 读 一 致 性 

本 节 我 们 简要 地 介绍 一 下 Oracle 是 如 何 实现 多 版 本 读 一 致 性 协议 的 。 主 要 涉及 回 滚 段 、 
系统 改变 号 (System Change Number, SCN) 和 锁 。 
回 深 段 

回 滚 段 是 Oracle 数据 库 中 用 于 存储 撤销 (undo) 信息 的 结构 。 当 事务 准备 修改 某 块 的 数 
据 时 ，Oracle 先 将 数据 的 前 像 写 入 回 滚 段 。 回 滚 段 除了 可 以 支持 多 版 本 读 一 致 性 协议 以 外 ， 
还 被 用 于 撤销 事务 。Oracle 还 保存 了 一 个 或 多 个 重 做 (redo) 日 志 , 日 志 中 记录 了 所 有 已 经 
发 生 的 事务 ， 在 系统 出 现 故 障 时 可 以 利用 重 做 日 志 进 行 恢 复 。 
系统 改变 号 

为 了 维护 操作 正确 的 执行 次 序 ，Oracle 提供 了 一 种 叫 作 系统 改变 号 (SCN) 的 机 制 。 
SCN 是 一 种 逻辑 时 间 戳 ， 记 录 了 操作 的 执行 次 序 。Oracle 将 SCN 存储 在 重 做 日 志 中 ， 以 便 
将 来 能 按 正 确 的 顺序 重 做 事务 。 根 据 SCN 判断 事务 应 该 使 用 数据 项 的 哪个 版 本 。Oracle 还 
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利用 SCN 来 决定 何 时 可 以 清除 回 滚 段 中 保存 的 信息 。 
锁 
尽管 Oracle 提供 了 一 种 机 制 ， 使 得 用 户 能 够 手工 加 锁 或 者 更 改 默认 的 加 锁 方 式 ， 但 其 
实 Oracle 对 所 有 的 SQL 语句 都 会 隐 式 地 加 锁 ， 因 此 用 户 无 需 对 任何 资源 进行 显 式 加 锁 。 默 
认 的 加 锁 机 制 是 对 限制 范围 内 最 低层 的 数据 加 锁 ， 从 而 在 最 大 限度 支持 并 发 的 同时 保证 完整 
H. REWE DBMS 将 行 级 锁 中 的 信息 存储 在 主 存 的 列表 中 ， 但 是 Oracle 却 将 行 级 锁 的 信 
息 存 储 在 该 行 所 在 的 物理 数据 块 中 。 
正如 在 22.2 节 讨 论 那样 ， 一 些 DBMS 还 允许 锁 的 升级 。 比 如 ， 如 果 SQL 语句 请 求 对 
表 中 的 大 多 数 行进 行 加 锁 ， 则 一 些 DBMS 就 会 将 行 级 锁 升 级 为 表 级 锁 。 尽 管 这 样 减少 了 
DBMS 需要 管理 的 锁 的 数量 ， 但 是 也 把 一 些 不 需要 修改 的 行 加 了 锁 ， 这 就 潜在 地 降低 了 并 发 
性 ， 并 且 增 加 了 和 死 锁 的 可 能 性 。 由 于 Oracle 在 数据 块 中 存储 行 锁 ， 因 此 Oracle 不 需要 对 锁 
升级 。 
只 要 有 这 样 一 个 事件 发 生 ，Oracle 就 会 自动 释放 锁 ， 意 味 着 事务 不 再 要 求 这 个 资源 了 。 
大 多 数 情况 下 ， 数 据 库 会 在 事务 期 间 一 直 持 有 该 事务 语句 获得 的 锁 。 这 些 锁 能 保证 当前 事务 
不 会 遭 到 破坏 性 和 干扰， 比如 污 读 、 丢 失修 改 和 破坏 性 DDL。Oralce 会 在 事务 交付 或 回 滚 时 
释放 该 事务 的 语句 获得 的 所 有 锁 。 它 也 会 在 回 退 到 一 个 保留 点 后 释放 该 保留 点 之 后 获得 的 那 
些 锁 。 然 而 ， 只 有 那些 不 等 待 前 面 已 被 锁 资 源 的 事务 能 获得 目前 可 用 资源 上 的 锁 。 处 于 等 待 
状态 的 事务 只 能 继续 等 待 ， 直 到 原来 的 事务 完成 交付 或 回 深 。 
Oracle 支持 多 种 类 型 的 锁 ， 包括 : 
© DDL 锁 。 用 于 保护 模式 对 象 ， 比 如 表 和 视图 的 定义 。DDL 锁 分 为 三 类 : 
e Fe DDL 锁 ， 为 防止 与 其 他 并 发 操作 相互 干扰 ， 大 多 数 DDL 操作 都 要 加 此 锁 。 
e 共享 DDL 锁 ， 它 能 防止 冲突 操作 的 干扰 ， 但 允许 与 类 似 的 操作 (如 CREATE 
VIEW/PROCEDURN/FUNCTION/TRIGGER) 并 发 。 
m 可 解除 分 析 锁 ， 这 些 锁 由 在 共享 池 的 SQL 语句 (ER PL/SQL 程序 单元 ) FRA, FP 
对 涉及 的 每 个 模式 对 象 。 分 析 锁 并 不 驳回 任何 DDL 操作 ， 目 的 是 允许 解除 冲突 
的 DDL 操作 (故而 得 名 )。 
© DML 锁 。 用 于 保护 基本 数据 ， 比 如 保护 整个 表 的 表 锁 和 保护 指定 行 的 行 锁 。QOracle 
支持 以 下 类 型 表 级 锁 (从 限制 最 少 到 限制 最 多 ); 
a 行 共 享 表 级 锁 (也 叫 子 共享 表 级 锁 ) : 表示 事务 已 经 对 表 中 的 行 加 锁 并 且 有 意 问 更 


新 它们 。 
e 行 互 斥 表 级 锁 (也 叫 子 互 斥 表 级 锁 ) : 表示 事务 已 经 对 表 中 的 行 执 行 了 一 个 或 多 个 
更 新 操作 。 


me 共享 表 级 锁 : 允许 其 他 事务 访问 该 表 。 

m HERRE (也 叫 共 享 子 互 斥 表 级 锁 ) : 任何 时 候 仅 一 个 事务 能 获得 给 定 表 
上 的 这 样 一 个 锁 ， 它 允许 其 他 事务 查询 表 ， 但 不 能 更 新 表 。 

BRAM: 允许 事务 以 互 斥 的 方式 访问 表 。 

内 部 锁 存 器 : 用 于 保护 系统 全 局 区 (SGA) 中 的 共享 数据 结构 。 

e Mutex, Jt EE XT (mutex) 用 于 阻止 内 存 中 的 对 象 被 并 发 的 进程 破坏 。 它 类 似 
于 锁 存 器 ， 但 公共 互 斥 对 象 保护 的 是 单个 对 象 ， 而 锁 存 器 保护 的 是 一 组 对 象 。 

e 内 部 锁 。 用 于 保护 数据 字典 的 条 目 、 数 据 文 件 、 表 空间 以 及 回 深 段 。 
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e 分 布 锁 。 用 于 保护 在 分 布 和 并 行 服 务 器 环境 中 的 数据 。 
© PCM 锁 。 并 行 高 速 缓存 管理 (PCM) 锁 被 用 于 保护 并 行 服 务 器 环境 中 的 高 速 缓存 。 


22.5.3 ” 死 锁 检测 


Oracle 目 动 检测 死 锁 ， 将 引起 死 锁 的 语句 回 滚 以 解决 死 锁 ， 并 回回 滚 了 语句 的 事务 发 送 
消息 以 通知 该 事务 。 通 和 常 ， 收 到 消息 的 事务 应 该 显 式 地 执行 回 滚 ， 该 事务 也 可 以 等 一 段 时 间 
后 重 试 被 回 滚 的 语句 。 


22.5.4 备份 和 恢复 


Oracle 提供 了 复杂 的 备份 和 恢复 服务 ， 以 及 支持 高 可 用 性 的 服务 机 制 。 对 这 些 服务 机 制 
的 完整 叙述 超出 了 本 书 的 范围 ， 因 此 ， 我 们 对 其 中 一 些 显著 的 特征 进行 讨论 。 感 兴趣 的 读者 
可 以 参考 Oracle 文档 以 获取 进一步 的 信息 (Oracle Corporation, 2011c). 
恢复 管理 器 | 

Oracle WEE Mir (RMAN) 文 持 所 管理 服务 需 的 备份 和 恢复 ， 包 括 了 以 下 机 制 

© 将 一 个 或 多 个 数据 文件 备份 到 磁盘 或 者 磁带 。 

e 将 归档 的 重 做 日 志 备 份 到 磁盘 或 者 磁带 。 

e 从 磁盘 或 磁带 上 还 原 数据 文件 。 

© 还 原 并 应 用 归档 的 重 做 日 志 进 行 恢 复 。 

RMAN 保存 了 备份 信息 的 目录 ， 并 有 能 力 进行 完全 备份 或 者 递增 备份 。 后 者 只 存储 自 
上 一 次 备份 以 来 被 修改 的 数据 块 。 
实例 恢复 

当 Oracle 的 一 个 实例 在 故障 后 重启 时 ，Oracle 可 以 根据 控制 文件 及 数据 库 文件 的 文件 
头 中 的 信息 ,检测 到 发 生 了 故障 。Oracle 会 根据 重 做 日 志文 件 ， 利 用 前 滚 和 回 滚 的 方法 ， 将 
数据 库 恢 复 到 一 个 一 致 的 状态 ， 就 像 我 们 在 22.3 节 中 讨论 的 那样 。Oracle 还 允许 通过 初始 
化 文件 (INIT.ORA) 中 的 一 个 参数 设置 间隔 定期 做 检查 点 ， 若 该 参数 被 置 为 零 ， 则 禁用 检 
查 点 。 
时 间 点 恢复 

在 Oracle 的 早期 版 本 中 ， 基 于 时 间 点 的 恢复 能 够 利用 备份 和 重 做 信息 将 数据 库 文件 恢 
复 到 某 指定 的 时 间 点 或 者 系统 改变 号 (SCN) 的 那 一 时 刻 。 在 发 生 了 错误 并 且 要 求 数据 库 必 
须 被 恢复 到 一 个 特定 的 时 间 点 时 ， 这 种 机 制 就 很 有 用 (比如 ， 用 户 误 删除 了 一 个 表 )。Oracle 
对 这 个 机 制 进 行 了 扩展 ， 人 允许 表 空 间 级 的 时 间 点 恢复 ， 即 允许 将 一 个 或 多 个 表 空 间 恢 复 到 某 
个 时 间 点 。 
备用 数据 库 

Oracle 会 维护 一 个 备用 数据 库 以 备 在 主 数 据 库 故 障 时 使 用 。 备 用 数据 库 可 以 存储 在 一 个 
与 主 数据 库 不 同 的 地 方 ， 当 注入 重 做 日 志 时 ，Oracle 会 将 其 迁移 到 备用 数据 库 所 在 站 点 上 ， 
并 应 用 于 备用 数据 库 。 这 保证 了 备用 数据 库 基 本 上 能 同步 更 新 。 另 外 一 个 特征 是 ， 可 以 利用 
备用 数据 库 进 行 只 读 操 作 ， 从 而 替 主 数据 库 分 担 一 些 负载 。 
闪 回 技术 

Oracle 的 内 回 技术 (flashback) 是 对 传统 备份 恢复 技术 的 一 种 替换 。 闪 回 允 许 看 到 数据 
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过 去 的 状态 ， 根 据 时 间 回 移 数据 库 而 无 需 从 备份 中 重 存 数 据 。 实 际 上 只 需 一 条 命令 就 能 
回 绕 整 个 数据 库 ， 或 让 某 个 表 回 到 过 去 某 个 时 刻 。 闪 回 机 制 应 比 正常 情形 下 的 介质 恢复 
更 高 效 ， 同 时 破坏 性 更 小 。 然 而 ， 它 不 是 真正 意义 下 的 介质 恢复 ， 因 为 它 不 涉及 再 存 物 理 
文件 。 

Oracle 用 过 去 的 块 映像 使 数据 库 回 到 变化 前 的 样子 。 在 正常 数据 库 操作 期 间 ，Oracle 间 
或 在 闪 回 日 志 中 顺序 记 下 块 映像 。Oracle 自动 地 创建 、 删 除 在 闪 回 恢复 区 的 内 回 日 志 ， 以 及 
重 置 其 大 小 。 利 用 SQL 的 FLASHBACK DATABASE 语句 ， 闪 回 日 志 中 的 前 像 先 把 数据 库 
带 回 到 过 去 的 某 一 时 刻 ， 再 用 问 前 恢复 把 数据 库 带 到 过 去 的 一 个 一 致 状态 。Oracle 只 把 数据 
文件 带 回 到 过 去 某 一 时 刻 ， 而 不 改变 辅助 文件 ， 比 如 初始 化 参数 文件 。 

当 数 据 库 在 线 时 ， 利 用 SQL 的 FLASHBACK TABLE 语句 ， 可 以 把 表 以 及 相关 的 索引 、 
触发 器 和 约束 回 绕 到 过 去 的 某 个 存储 点 或 某 个 时 间 点 ， 所 撤销 的 修改 仅 限 于 指定 的 表 。 例 
如 ， 我 们 能 用 下 面 的 语句 将 表 Staff 再 存 成 特定 时 刻 的 样子 : 

FLASHBACK TABLE Staff 

TO TIMESTAMP TO TIMESTAMP(‘2013-11-16 09:00:00’, ‘YYYY-MM-DD 

HH:MI:SS’); 

这 个 语句 并 没 解 决 物理 问题 ， 比 如 磁盘 损坏 、 数 据 段 不 一 致 或 索引 不 一 致 等 。 效 果 上 ， 
该 语句 就 像 一 个 自助 服务 工具 ， 镍 某 个 用 户 不 小 心 删 了 表 中 重要 的 几 行 ， 则 通过 将 表 重 存 为 
删除 前 的 样子 ， 这 些 行 目 然 就 恢复 了 。 

该 语句 还 能 用 于 消除 DROP TABLE 语句 的 效果 。 它 比 在 此 情形 下 能 用 的 其 他 恢复 机 
制 都 快 得 多 ， 比 如 时 间 点 恢复 ， 而 且 不 会 导致 丢失 新 近 事 务 和 系统 停 运 。 当 表 被 撤销 时 ， 
Oracle 并 不 立即 释放 该 表 占 用 的 空间 。Oracle 用 再 循环 箱 (recycle bin) 管理 撤销 的 数据 库 
对 象 ， 直 到 其 占用 的 空间 需要 存储 新 的 数据 。 上 再 循环 箱 能 用 SHOW RECLCLEBIN 语句 或 通 
过 检索 Reclclebin 表 查 看 ; 例如 : 


SELECT object name AS recycle name, original name, type 
FROM Recyclebin; 


Recycle_Name Original_Name Type 

BIN$sk34sa/3alkShg3k2IbI7j2s==$0 STAFF TABLE 

BIN$SKS483273B | ascb5hsz/l4 | 9==$0 | LNAME_STAFF INDEX 
下 面 的 语句 能 用 于 恢复 Staff 表 : 

FLASHBACK TABLE “BIN$sk34sa/3alkS5hg3k21bl7j2s==$0” TO BEFORE 

DROP; 


或 者 用 原来 的 表 名 ， 也 可 为 恢复 后 的 表 起 个 新 名 字 : 
FLASHBACK TABLE Staff TO BEFORE DROP 
RENAME TO RestoredStaff; 
闪 回 查询 。 闪 回 查询 能 使 用 户 查 看 和 修改 历史 数据 。 闪 回 查询 需 在 SELECT 语句 中 用 
AS OF 子 句 标明 。 这 个 子 句 通过 时 间 惟 或 SCN (系统 改变 号 ) 指明 一 个 过 去 的 时 间 。 查 询 返 
回 那 一 时 刻 最 新 的 交付 数据 。 例 如 ， 我 们 能 用 下 面 的 查询 获得 员工 White 在 两 个 时 间 间 隅 的 
工资 数 : 
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SELECT salary 

FROM Staff 

VERSIONS BETWEEN SYSTIMESTAMP-INTERVAL ‘10’ MINUTE AND 
SYSTIMESTAMP-INTERVAL ‘1’ MINUTE 

WHERE lIName = ‘White’; 


能 用 下 面 的 语句 将 工资 改 回 为 原来 的 值 : 


UPDATE Staff SET salary = 
(SELECT salary 
FROM Staff AS OF TIMESTAMP (SYSTIMESTAMP-INTERVAL ‘2’ 
MINUTE) 
WHERE |Name = ‘White’) 
WHERE IName = ‘White’; 
闪 回 查询 使 用 多 版 本 读 一 致 性 机 制 来 实现 应 用 所 要 求 的 撤销 重 存 数据 。Oracle 中 有 一 个 
称 为 撤销 意向 间隔 (undo intention period) 的 参数 ， 它 指出 多 长 时 间 之 后 能 够 覆盖 原来 的 撤 
销 信息 一 一 也 就 是 已 交付 事务 的 撤销 信息 。 数 据 库 收集 使 用 的 统计 数据 ， 根 据 统计 数据 和 撤 
销 表 空间 的 大 小 来 调整 撤销 意 回 间 隅 的 值 。 


本 章 小 结 

e 并 发 控制 是 管理 数据 库 上 的 并 发 操作 以 使 之 互 不 冲突 的 过 程 。 数 据 库 恢复 是 在 发 生 故 障 以 后 将 数据 

库 还 原 到 一 个 正确 状态 的 过 程 。 两 者 都 是 为 了 保护 数据 库 ， 以 免 数据 库 出 现 不 一 致 的 状态 或 数据 遭 

到 破坏 。 

事务 是 由 单个 用 户 或 应 用 程序 执行 的 ， 完 成 读 取 或 者 更 新 数据 库 内 容 的 一 个 或 者 一 串 操作 。 事 务 是 

使 数据 库 从 一 个 一 致 的 状态 转换 到 另 一 个 一 致 状态 的 逻辑 工作 单位 。 事 务 可 能 会 成 功 结束 (FB), 

也 可 能 不 成 功 结束 (撤销 (absort) )。 被 撤销 (absort) 的 事务 必须 被 撤销 (undo) 或 者 回 滚 。 事 务 也 

是 并 发 和 恢复 的 基本 单位 。 

© 事务 应 该 具备 被 称 为 ACID 的 四 个 基本 特性 : 原子 性 、 一 致 性 、 隅 离 性 和 持久 性 。 原 子 性 和 持久 性 
是 由 恢复 子 系统 负责 保证 的 ; 隔离 性 是 由 并 发 控制 子 系统 负责 保证 的 ， 从 某 种 程度 上 来 说 ， 一 致 性 
也 是 由 并 发 控制 子 系统 负责 保证 的 。 

e 当 人 允许 多 个 用 户 同时 访问 数据 库 时 ， 必 须 进 行 并 发 控制 ， 和 否则 可 能 会 发 生 丢失 更 新 、 未 提交 依赖 、 不 
一 致 分 析 等 问题 。 串 行 执行 意味 着 一 次 只 能 执行 一 个 事务 ， 操 作 之 间 不 存在 重合。 调度 生成 事务 操作 
的 执行 序列 。 如 果 一 个 调度 能 够 产生 与 某 个 串 行 调度 相同 的 执行 结果 ， 这 个 调度 就 是 可 串 化 行 的 。 

© 保证 可 串 行 化 的 两 种 方法 是 两 段 锁 ( 2PL) 和 时 间 戳 。 锁 可 以 是 共享 的 ( 读 ) 或 者 互 斥 的 ( 写 )。 在 两 
段 锁 协 议 中 ， 事 务 在 释放 任意 一 个 锁 之 前 必须 获得 它 所 需要 的 所 有 锁 。 在 时 间 戳 协议 中 ， 一 旦 出 现 
冲突 ， 事 务 排序 的 方式 是 较 早 的 事务 具有 较 高 的 优先 级 。 

© 当 两 个 或 更 多 事务 相互 等 待 访问 被 对 方 加 锁 的 数据 时 ， 便 会 发 生死 锁 。 一 旦 发 生死 锁 ， 唯一 打破 死 
锁 的 方法 就 是 撤销 其 中 一 个 或 者 多 个 事务 。 

© 当 系 统 允 许 对 不 同 大 小 的 数据 项 加 锁 时 ， 可 以 用 树 来 表示 加 锁 的 粒度 。 若 某 数据 项 被 加 了 锁 ， 则 该 
数据 项 的 所 有 子孙 节点 也 被 加 了 锁 。 当 一 个 新 事务 请 求 对 某 对 象 加 锁 时 ， 可 以 很 容易 地 检查 该 对 象 
的 所 有 祖先 以 确定 它们 是 否 已 被 加 锁 。 如 果 需 要 在 某 节点 的 任 一 子孙 节点 上 加 锁 ， 则 需要 对 该 节点 
的 所 有 祖先 都 加 上 意向 锁 。 

© 引起 系统 故障 的 原因 有 : 系统 衣 泪 、 介 质 故 障 、 应 用 软件 错误 、 误 操作 、 目 然 物 理 灾 害 以 及 人 为 蓄 
意 破 坏 。 这 些 故 障 可 能 导致 内 存 或 者 数据 库 磁 盘 备 份 的 丢失 。 人 恢复 技术 将 尽量 减少 上 述 损失 。 
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实施 恢复 的 一 种 方法 就 是 ， 由 系统 维护 一 个 日 志文 件 ， 日 志文 件 中 包含 事务 的 启动 /结束 、 事 务 写 操作 


的 前 像 和 后 像 这 样 一 些 事务 记录 。 若 采用 延迟 修改 技术 ， 写 操作 最 初 只 在 日 志文 件 中 记录 ， 以 后 再 根 
据 日 志 记 录 对 数据 库 进行 真正 的 更 新 。 如 果 出 现 故 障 ， 则 系统 对 日 志 进 行 分 析 以 决定 哪些 事务 需要 
重 做 ,但 是 不 需要 撤销 任何 写 操作 。 若 采用 立即 修改 技术 ， 则 在 写 操 作 被 写 和 日志 记录 以 后 的 任意 
时 间 都 可 以 将 这 次 写 操作 的 结果 写 入 数据 库 。 当 故障 发 生 时 , 可 以 根据 日 志 对 事务 进行 撤销 和 重 做 。 

© 检查 点 被 用 来 提高 数据 库 的 可 恢复 性 。 在 检查 点 ， 所 有 被 修改 的 缓冲 块 、 所 有 的 日 志 记 录 以 及 一 个 
记录 了 所 有 活跃 事务 的 检查 点 记录 都 被 写 人 人 磁盘。 如果 发 生 了 故障 ， 查 看 检查 点 记录 就 可 以 知道 哪 
些 事务 需要 重 做 。 

© 高 级 事务 模型 包括 钳 套 事务 、Saga、 多 级 事务 、 动 态 重 构 事 务 和 工作 流 模型 。 


思考 题 


22.1 
22.2 


22.3 
22.4 


22.5 
22.6 
22.7 
22.8 
22.9 
22.10 


22.11 


22.12 


22.13 


22.14 


22.15 
22.16 


解释 什么 是 事务 。 为 什么 在 DBMS 中 事务 是 一 个 重要 的 操作 单位 ? 

事务 的 ACID 特性 是 保证 事务 的 可 靠 性 和 一 致 性 的 基础 。 分 析 每 一 种 特性 并 讨论 它们 是 如 何 与 
并 发 控制 和 恢复 机 制 相关 联 的 。 举 例 说 明 。 

举例 说 明 在 一 个 多 用 户 的 环境 中 ， 当 允许 对 数据 库 进 行 并 发 访问 时 ， 会 发 生 哪 些 类 型 的 问题 。 
给 出 一 种 并 发 控制 机 制 以 确保 不 会 发 生 习 题 22.3 中 出 现 的 问题 ， 请 给 出 详细 说 明 。 分 析 该 机 制 
如 何 防止 上 述 问 题 的 发 生 ， 并 讨论 该 并 发 控制 机 制 是 如 何 与 事务 机 制 相互 作用 的 。 

解释 什么 是 串 行 调度 、 非 串 行 调度 和 可 串 行 化 调度 。 痢 明 调 度 等 价 的 原则 。 

讨论 冲突 可 串 行 化 和 视图 可 串 行 化 之 间 的 区 别 。 

讨论 基于 锁 机 制 的 并 发 控制 中 可 能 产生 的 问题 以 及 DBMS 为 避免 这 些 问 题 所 采取 的 措施 。 

为 什么 两 段 锁 不 是 一 种 适用 于 索引 的 并 发 控制 机 制 ? 给 出 一 种 更 适合 树 状 索引 的 加 锁 机 制 。 
什么 是 时 间 戳 ?基于 时 间 惟 的 并 发 控制 协议 与 基于 锁 的 并 发 控制 协议 有 何不 同 ? 

描述 基本 时 间 戳 排序 并 发 控制 协议 。 什 么 是 托马斯 写 规则 ? 托马斯 写 规 则 对 基本 时 间 戳 排序 协 
议 有 何 影响 ? 

描述 如 何 使 用 版 本 来 提高 并 发 性 。 

讨论 悲观 并 发 控制 和 乐观 并 发 控制 的 区 别 。 

讨论 在 数据 库 环境 中 可 能 出 现 的 故障 的 类 型 。 解 释 为 什么 对 一 个 多 用 户 的 DBMS 来 说 ， 提 供 
恢复 机 制 很 重要 。 

讨论 为 何 日 志文 件 (或 称 日 记 ) 是 各 种 恢复 机 制 的 基本 特性 。 解 释 什 么 是 回 前 恢复 ， 什 么 是 回 
后 恢复 。 日 志文 件 在 向 前 恢复 和 向 后 恢复 中 发 挥 了 什么 作用 ? 先 写 日 志 协 议 的 重要 意义 是 什 
么 ? 检查 点 对 恢复 协议 的 影响 是 什么 ? 

比较 延迟 修改 恢复 协议 和 立即 修改 恢复 协议 。 

讨论 下 列 高 级 事务 模型 

(a) REFS 

(b) Saga 

(c) 多 级 事务 

(d) 动态 重 构 事 务 


习题 


2247 


分 析 你 正在 使 用 的 DBMS。 这 些 DBMS 都 使 用 哪些 并 发 控制 协议 ? 支持 哪些 类 型 的 恢复 机 
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22.18 


22.19 
22.20 


22.21 


22.22 


22.23 
22.24 
22.25 
22.26 


22.27 
22.28 
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制 ? 对 在 22.4 节 中 讨论 的 高 级 事务 模型 又 提供 了 怎样 的 支持 ? 

对 于 下 列 每 一 个 调度 ,说明 其 是 否 为 可 串 行 化 调度 、 剖 突 可 串 行 化 调度 、 视 图 可 串 行 化 调度 、 

可 恢复 调度 ， 以 及 是 否 能 够 避免 级 联 撤销 。 

(a) read(T,, bal,), read(T,, bal,), write(T,, bal,), write(T,, bal,), commit(T,), commit(T,) 

(b) read(T,, bal,), read(T,, bal,), write(T;, bal,), read(T,, bal,), read(T,, bal,), commit(T,), commit(T,), commit(T,) 

(c) read(T,, bal,), write(T,, bal,), write(T,, bal,), abort(T,), commit(T,) 

(d) write(T,, bal,), read(T,, bal,), write(T,, bal,), commit(T,), abort(T,) 

(e) read(T,, bal,), write(T,, bal,), write(T,, bal,), read(T,, bal,), commit(T,), commit(T,), commit(T;) 

给 出 上 题 中 的 调度 (a) 到 (e) 的 优先 图 。 

(a) 解释 什么 是 限定 写 规则 。 在 限定 写 规则 下 ， 人 怎样 测 试 一 个 调度 是 否 为 冲突 可 串 行 的 ? 运用 
这 种 方法 ， 判 断 下 面 的 调度 是 否 是 可 串 行 的 。 
> ee RON: W2(7), RCO, RES, W9, WZ), Wa(Y), ROS), RO), Wi 01), W9, Ra(W), 
其 中 Ri(Z)/Wi(Z) 是 指 事务 i 对 数据 项 Z 的 读 / 写 操作 。 

(b) 基于 可 串 行 化 生成 并 发 控制 算法 是 否 明智 ? 论证 你 的 观点 。 可 串 行 化 在 标准 的 并 发 控制 协 
议 算 法 中 是 如 何 使 用 的 ? 

(a) 讨论 怎样 利用 带 标记 的 优先 图 对 视图 可 串 行 化 进行 检测 。 

(b) 采用 前 面 的 方法 ， 判 断 下 列 调度 是 否 为 冲突 可 串 行 的 。 


(i) 5, = [R00, W209, W09] 
(ii) S2 = [W.08), R209, W09, W209] 
(iii) S3 = [Wi X), Ra(X), Rs) W3(X), Wa(X), W09] 


生成 下 面 事 务 场景 的 等 竺 图， 并 判断 是 否 存在 死 锁 。 


CE rT 


给 出 实现 共享 锁 和 互 斥 锁 的 算法 。 说 明 粒 度 对 算法 的 影响 。 

给 出 检测 并 发 执行 的 事务 是 否 处 于 死 锁 的 算法 。 

结合 例 22.1 、 例 22.2 和 例 22.3 给 出 的 事务 案例 ， 说 明 如 何 利用 时 间 戳 生成 可 串 行 化 调度 。 

图 22-22 给 出 了 一 个 维 恩 (Venn) K, 说 明了 冲突 可 串 行 化 、 视 图 可 串 行 化 、 两 段 锁 和 时 间 
截 协 议 之 间 的 关系 。 对 该 图 进行 扩充 ,使 之 包括 乐观 的 和 多 版 本 的 并 发 控制 协议 。 进 一 步 
扩充 它 ， 使 之 区 分 2PL 和 严格 2PL 、 无 托马斯 写 规则 的 时 间 惟 和 带 托马斯 写 规则 的 时 间 截 
协议 。 

解释 为 什么 不 可 能 实现 真正 的 稳定 存储 。 怎 样 模拟 稳定 存储 ? 

对 DBMS 来 说 是 动态 地 维护 等 待 图 更 现实 ， 还 是 在 每 次 执行 死 锁 检 测算 法 时 临时 生成 等 待 图 
更 现实 ? 解释 你 的 答案 。 
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查询 处 理 





| 本 章 目标 
本 章 我 们 主要 学 习 : 
查询 处 理 和 优化 的 目标 
静态 与 动态 查询 优化 
查询 如 何 进行 分 解 和 语义 分 析 
如 何 创建 表示 查询 的 关系 代数 树 
关系 代数 运算 的 等 价 规则 
如 何 运 用 启发 式 变 换 规则 改进 查询 效率 
为 估计 运算 的 开销 需要 哪些 类 型 的 数据 库 统 计数 据 
实现 关系 代数 运算 的 不 同 策略 
如 何 估计 关系 代数 运算 的 开销 和 结果 大 小 
如 何 利 用 流水 线 技术 提高 查询 效率 
物化 与 流水 线 的 差别 
左 深 树 的 优点 
找 出 最 优 执行 策略 的 方法 
关系 查询 处 理 的 扩展 和 支持 高 级 查询 的 查询 优化 
Oracle 的 查询 优化 策略 


当 关 系 模型 刚刚 开始 商用 时 ， 常 常 被 批判 的 一 点 就 是 查询 性 能 低 。 从 那 以 后 ， 大 量 的 研 
究 工 作 都 致力 于 开发 高 性 能 的 查询 处 理 算法 。 执 行 复 杂 查 询 的 方式 很 多 ， 而 查询 处 理 的 目标 
之 一 就 是 确定 哪 一 种 方法 最 节省 开销 。 

在 第 一 代 网 状 和 层次 数据 库 系统 中 ， 低 级 的 过 程 查询 语言 通常 被 褒 人 高 级 编程 语言 ( 例 
如 COBOL) 中 ， 而 由 程序 员 负责 选择 最 合适 的 执行 策略 。 比 较 起 来 ， 当 SQL 这 样 的 语言 出 
现 之 后 ， 用 户 仅仅 需要 告诉 系统 查询 什么 而 不 是 怎样 查询 ， 这 样 一 来 ， 用 户 不 必 负 责 决 策 ， 
甚至 也 不 必 知 道 什 么 是 好 的 执行 策略 ， 从 而 语言 的 使 用 变 得 更 为 广泛 。 另 外 ,由 DBMS ff 
责 选择 最 佳 策略 而 不 是 由 用 户 选 择 ， 这 可 以 提高 效率 ， 因 为 用 户 选 择 往 往 低 效 ， 而 这 种 方式 
还 可 以 让 DBMS 更 好 地 管控 系统 性 能 。 

查询 优化 技术 主要 有 两 种 ， 尽 管 在 实际 应 用 中 通常 会 将 两 者 合 二 为 一 。 一 种 方法 是 利 
用 局 发 式 规 则 对 查询 中 的 运算 重新 排序 。 另 一 种 方法 是 比较 不 同 策略 的 开销 ， 选 择 资源 占 
用 率 最 小 的 策略 。 因 为 相对 于 内 存 来 说 ， 磁 盘 的 访问 速度 要 慢 得 多 ， 对 于 集中 式 的 DBMS 
而 言 ， 查 询 处 理 最 大 的 开销 就 是 磁盘 访问 开销 ， 而 这 也 是 本 章 在 估算 查询 开销 时 所 主要 关 、 
注 的 。 
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| 本 章 结 构 

23.1 节 将 概括 性 地 论述 查询 处 理 及 其 主要 步骤 .23.2 节 将 重点 论述 查询 处 理 的 第 一 阶段 ， 
即 查询 解析 ， 该 阶段 将 高 级 查询 转化 为 关系 代数 查询 ， 并 对 其 进行 语法 和 语义 的 检查 。23.3 
节 将 研究 查询 优化 的 启发 式 方法 ， 启 发 式 方法 根据 转换 规则 对 查询 中 的 运算 重新 排序 ， 以 产 
生 良 好 的 执行 策略 。23.4 节 将 讨论 查询 的 代价 估算 方法 ， 通 过 比较 不 同 策略 的 开销 ， 选 择 其 
中 资源 占用 最 小 的 策略 。23.5 节 将 讨论 流水 线 技术 ,流水 线 技 术 可 以 进一步 提高 查询 处 理 的 
效率 。 流 水 线 允 许多 个 运算 并 行 执行 ， 这 样 ， 不 必 等 待 一 个 操作 的 结束 就 可 以 开始 执行 另外 
一 个 操作 了 。 我 们 还 分 析 了 一 个 典型 的 查询 处 理 器 是 如 何 选择 最 佳 执行 策略 的 。 在 第 9 章 ， 
我 们 讨论 过 关系 模型 的 面向 对 象 扩展 ， 包 括 用 户 自 定义 类 型 和 用 户 自 定义 函数 。23.6 节 我 
们 讨论 为 满足 这 些 扩展 ， 查 询 处 理 与 优化 需要 进行 那些 改变 。 在 最 后 一 节 ， 我 们 简要 地 分 析 
Oracle 的 查询 优化 方式 。 

本 章 主要 介绍 集中 式 关 系 DBMS 的 查询 处 理 和 优化 技术 。 集 中 式 关 系 DBMS 这 一 领域 
引起 了 最 广泛 的 关注 ， 因 此 也 是 本 书 的 重点 所 在 。 我 们 所 讨论 的 一 些 技术 通常 也 适用 于 其 他 
类 型 的 具有 高 层 接口 的 系统 。 以 后 ， 还 会 简要 介绍 分 布 式 DBMS 的 查询 处 理 。 

在 学 习 本 章 之 前 ， 读 者 需要 熟悉 $.1 节 关 系 代数 的 概念 以 及 附录 下 中 文件 组 织 的 概念 。 
本 章 示例 引 自 11.4 节 和 附录 A 的 DreamHome 案例 研究 。 


23.1 查询 处 理 概述 
| 查询 处 理 | 包括 语法 分 析 、 正 确 性 验证 、 查 询 优 化 以 及 查询 执行 等 活动 。 


查询 处 理 的 目标 是 将 高 级 语言 (例如 SQL) 表示 的 查询 转换 为 正确 有 效 的 、 用 低级 语言 
(实现 关系 代数 ) 表达 的 执行 策略 ， 并 执行 该 策略 以 获取 所 需 检索 的 数据 。 


| 查询 优化 | 为 查询 处 理 选择 一 个 高 效 的 执行 策略 。 


查询 处 理 一 个 重要 的 步骤 就 是 查询 优化 。 由 于 与 一 个 高 级 查询 等 价 的 转换 形式 有 多 种 ， 
所 以 查询 优化 的 目标 就 是 选择 其 中 资源 占用 最 少 的 一 种 。 通 常 ， 要 尽力 减少 查询 的 执行 时 
间 。 查 询 执行 时 间 等 于 查询 中 所 有 运算 执行 时 间 的 总 和 (Selinger et al.，1979 )。 男 外 ， 资 
源 利 用 也 可 被 考虑 为 一 种 查询 的 响应 时 间 ， 此 时 ， 应 考虑 如 何 尽 力 增加 并 行 运算 的 数量 
( Valduriez and Gardarin，1984 ) 。 在 关系 个 数 很 多 的 情况 下 ， 这 个 问题 的 计算 比较 困难 。 通 
常 采取 的 策略 是 寻找 一 种 近似 最 优 解 (Ibaraki and Kameda, 1984 ) 。 

查询 优化 的 两 种 方法 都 需要 根据 数据 库 的 统计 数据 对 各 种 不 同 的 可 选 策 略 做 出 正确 的 评 
估 。 因 此 ， 统 计数 据 的 准确 性 和 即时 性 对 所 选 执行 策略 的 效率 评估 有 着 非常 大 的 影响 。 这 些 
统计 数据 涵盖 了 关系 、 属 性 和 索引 的 相关 人 信息。 例如， 系统 目录 中 存储 的 统计 数据 可 能 包括 
关系 基数 、 属 性 不 同 取 值 的 数目 和 多 级 索引 的 级 数 (参见 附录 F.5.4 )。 保 证 统计 数据 的 即时 
性 是 非常 困难 的 。 如 果 DBMS 在 每 次 插入 、 更 新 或 者 删除 一 个 元 组 的 时 候 都 要 更 新 统计 数 
据 ， 则 在 峰值 运行 期 间 ， 这 样 的 操作 将 会 对 性 能 造成 极 大 的 影响 。 一 种 可 选 的 、 通 常 也 是 更 
可 取 的 方法 是 周期 性 地 更 新 统计 数据 ， 例 如 在 每 天 晚上 或 者 任何 系统 空闲 的 时 候 。 男 一 种 可 
采纳 的 方法 就 是 由 用 户 自己 决定 更 新 统计 数据 的 时 机 。 我 们 将 在 23.4.1 节 详 细 讨 论 数 据 库 的 
统计 数据 。 

下 面 ， 我 们 将 举例 说 明 不 同 的 处 理 策略 对 资源 占用 的 不 同 影 啊 。 
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| 例 23.1 >> 不 同 处 理 策略 的 比较 
找 出 所 有 在 伦敦 分 公司 工作 的 经 理 。 
表达 上 述 查 询 的 SQL 语句 为 : 
SELECT * 
FROM Staff s, Branch b 


WHERE s.branchNo = b.branchNo AND 
(s.position = ‘Manager’ AND b.city = ‘London’); 


与 该 SQL 语句 等 价 的 三 个 关系 代数 查询 为 : 


(1) © (position="Manager’) a (city="London’) a (Staff.branchNo=Branch.branchNo)( Staff X Branch) 
(2) Gposition="Manager’) a (city="London’y (Staff >< stat branchNo=Branch.branchNo Branch) 


(3) (o position="Manager’ (Staff)) P< stabranchNo=Branch branchNo (Tcity="London'(Branch)) 


在 本 例 中 ， 假 定 Staff PA 1000 个 元 组 ，Branch 中 有 50 个 元 组 ，50 位 经 理 (每 个 分 公 
司 有 一 位 经 理 )， 在 伦敦 有 5 个 分 公司 。 我 们 把 实现 这 三 种 查询 所 需 的 磁盘 访问 次 数 做 个 比 
较 。 简 单 起 见 ， 假 定 任 一 关系 上 都 不 存在 索引 ， 也 没有 按 其 顺序 进行 排序 的 关键 字 ， 所 有 中 
间 运 算 的 结果 都 被 存储 在 磁盘 上 。 最 后 的 写 开 销 忽 略 不 计 ， 因 为 三 种 查询 策略 最 后 的 写 开 
销 是 一 样 的 。 我 们 进一步 假定 每 次 磁盘 读 写 只 访问 一 个 元 组 (尽管 实际 的 磁盘 访问 是 基于 块 
的 ， 通 常 每 次 访问 会 涉及 几 个 元 组 )， 并 且 内 存 的 容量 足以 处 理 每 个 关系 代数 运算 中 所 涉及 
的 整个 关系 。 

第 一 种 查询 策略 在 计算 Staff 和 Branch 的 笛 卡 儿 乘 积 时 ， 共 需要 〈1000 十 50 ) 次 磁盘 访 
问 ， 然 后 生成 一 个 包含 了 (1000X $0 ) 个 元 组 的 关系 。 接 着 再 挨个 读 取 这 些 元 组 ， 判 断 它 们 
是 否 满足 选择 谓词 ， 这 又 需要 (1000X50 ) 次 的 磁盘 访问 ， 所 以 总 的 开销 为 : 

(1000+50)+2 X (1000 X 50)= 101050 KH A F] 

第 二 种 查询 策略 根据 分 公司 编号 branchNo 对 Staff 和 Branch 执行 连接 操作 ， 则 读 取 这 
两 个 关系 的 所 有 的 元 组 需要 ( 1000 十 50 ) 次 磁盘 访问 。 我 们 知道 ， 这 两 个 关系 的 连接 操作 的 
结果 关系 中 含有 1000 个 元 组 ， 每 一 个 元 组 对 应 着 一 名 员工 (因为 每 一 名 员工 只 能 在 一 个 分 
公司 工作 )。 接 下 来 ， 为 执行 选择 运算 还 需要 进行 1000 次 磁盘 访问 以 读 取 连 接 操作 的 中 间 结 
果 ， 因 此 总 的 开销 为 : 

2X 1000+(1000+50)=3050 次 磁盘 访问 

最 后 一 种 查询 策略 首先 读 取 Staff 的 每 一 个 元 组 ， 以 选择 那些 职位 为 Manager 的 元 
组 ， 这 需要 1000 次 磁盘 访问 ， 生 成 一 个 含有 50 个 元 组 的 关系 。 第 二 个 选择 运算 需要 读 取 
Branch 的 所 有 元 组 ， 以 选择 所 有 伦敦 的 分 公司 ， 这 又 需要 50 次 的 磁盘 访问 ， 生 成 一 个 含有 
5 个 元 组 的 关系 。 最 后 将 执行 了 选择 操作 之 后 的 关系 Staff 和 Branch 进行 连接 ， 连 接 运算 需 
要 ( 50 十 5 ) 次 磁盘 访问 ， 所 以 总 的 开销 为 : 

1000+2 X 50+5+(50+5)=1160 次 磁盘 访问 

显然 ， 对 于 本 例 来 说 ， 第 三 种 策略 是 最 优 的 ， 与 第 一 种 查询 策略 相 比 ， 效 率 比 为 87 : 1。 如 
果 关 系 Staff 的 元 组 个 数 增加 到 10000, Branch 的 元 组 增加 到 500， 则 效率 比 将 增加 到 870 : 1。 
直观 地 看 ， 执 行 笛 卡 儿 乘积 运算 和 连接 运算 的 开销 比 选择 运算 的 开销 要 高 得 多 ， 第 三 种 查询 
策略 则 大 大 减少 了 进行 连接 运算 的 两 个 关系 的 元 组 个 数 。 稍 后 ， 我 们 就 可 以 看 到 查询 处 理 的 
一 个 基本 策略 就 是 尽 可 能 早 地 执行 选择 运算 和 投影 运算 等 一 元 运算 ， 以 减少 后 面 要 进行 二 元 
运算 的 运算 对 象 的 大 小 。 « 
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查询 处 理 分 为 四 个 主要 阶段 : 分 解 (包括 语法 分 析 和 正确 性 验证 )、 优 化 、 代 码 生 成 和 
代码 执行 ， 如 图 23-1 所 示 。 在 23.2 节 ， 
将 简要 地 分 析 第 一 阶段 一 一 分 解 ; 然后 讨 
论 第 二 阶段 一 一 查询 优化 。 在 本 节 的 最 后 ， 
我 们 将 简要 地 讨论 一 下 执行 查询 优化 的 
时 机 。 
动态 优化 与 静态 优化 

查询 处 理 前 三 个 阶段 的 执行 时 机 有 两 
种 选择 。 一 种 选择 是 每 次 运行 查询 时 动态 
地 进行 查询 的 分 解 和 优化 。 动 态 查询 优化 
的 优点 在 于 用 以 选择 最 优 策略 的 全 部 信息 
都 是 最 新 的 。 缺 点 是 查询 的 性 能 受到 了 影 
响 ， 因 为 在 每 次 执行 查询 前 都 要 进行 解析 、 
正确 性 验证 和 优化 。 而 且 ， 为 了 获得 可 接 tim 
受 的 开销 ， 也 许 还 有 必要 减少 待 分 析 的 执 
行 策略 的 数量 ， 因 而 可 能 导致 最 终 被 选择 
的 策略 不 是 最 优 的 。 

另 一 种 选择 是 静态 查询 优化 。 静 态 查 
询 优化 只 进行 一 次 解析 、 正 确 性 验证 和 优化 。 这 种 方法 类 似 于 编程 语言 的 编译 器 所 采用 的 方 
法 。 静 态 查询 的 优点 在 于 消除 了 每 次 运行 时 都 要 进行 解析 、 正 确 性 验证 和 优化 的 开销 ， 从 而 
有 更 多 的 时 间 对 更 多 的 执行 策略 进行 评估 ， 进 而 增加 发 现 更 好 策略 的 可 能 性 。 对 于 需要 多 次 
执行 的 查询 而 言 ， 为 了 选择 一 个 更 优 的 策略 而 多 花费 些 时 间 已 证 明 是 非常 值得 的 。 静 态 查 询 
的 缺点 在 于 编译 时 选择 的 最 优 策略 可 能 并 不 一 定 是 运行 时 最 优 的 策略 。 但 是 ， 我 们 可 以 用 一 
种 混合 的 策略 克服 这 一 缺点 : 如 果 系 统 检测 到 自 最 近 一 次 编译 查询 后 ， 数 据 库 的 统计 数据 发 
生 了 很 大 的 变化 ， 则 重新 优化 该 查询 。 或 者 ， 系 统 可 以 在 一 个 会 话 中 首次 执行 查询 时 进行 编 
译 ， 然 后 将 最 优 执行 计划 缓存 起 来 以 备 会 话 期 间 的 再 次 执行 ， 这 样 一 来 ， 开 销 被 分 散 到 了 整 
个 DBMS 的 会 话 期 间 。 


23.2 ”查询 解析 


查询 处 理 的 第 一 个 阶段 是 查询 解析 。 查 询 解 析 的 目标 是 将 高 级 查询 转换 为 关系 代数 查 
询 ， 并 且 分 析 语 法 和 语义 的 正确 性 。 查 询 解 析 通 常 又 可 分 为 以 下 几 个 阶段 : 分 析 、 规 范 化 、 
语义 分 析 、 化 简 和 查询 重 构 。 

分 析 

在 这 一 阶段 ， 利 用 程序 设计 语言 编译 器 的 技术 对 查询 进行 词法 分 析 和 语法 分 析 ( 可 参见 
Aho and Uliman，1977 )。 男 外 ， 这 一 阶段 还 负责 验证 查询 中 出 现 的 关系 和 属性 是 否 在 系统 
目录 中 有 定义 ， 并 且 还 要 检查 对 数据 库 对 象 施加 的 运算 是 否 与 对 象 的 类 型 相 匹 配 。 例 如 ， 考 
虑 下 面 的 查询 : 


SELECT staffNumber 
FROM Staff 
WHERE position > 10; 


用 高 级 语言 (如 SQL ) 
表达 查询 









关系 代数 表达 式 


编译 时 


23-1 查询 处 理 的 各 个 阶段 
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该 查询 将 被 拒绝 执行 ， 理 由 有 两 个 : 

(1) 出 现在 SELECT 的 列表 中 的 属性 staffNumber 在 关系 Staff 中 未 定义 (应 为 staffNo )。 

(2) Æ WHERE 了 于 名 中 ， 比 较 运算 “二 10” 和 position 的 煞 据 类 型 不 兼容 ， position 是 

可 变 长 字符 串 。 

这 一 阶段 的 任务 完成 以 后 ， 高 级 查询 被 转换 为 更 适合 处 理 的 内 部 表示 。 通 常 其 内 部 表示 
形式 为 某 种 类 型 的 查询 树 ， 构 造 方法 如 下 : 

e 为 查询 中 的 每 一 个 基础 关系 创建 一 个 叶 节 点 。 

© 为 关系 代数 运算 产生 的 每 一 个 中 间 关 系 创 Bi al Tk am 根 


建 一 个 非 叶 节点 。 RASTER: 
。 树 的 根 节点 代表 查询 结果 。 


o 运算 按照 从 叶 到 根 的 顺序 执行。 et rt 
pa el eee 的 | | | 
查询 树 ， 该 图 用 关系 代数 作为 其 内 部 表示 。 我 们 Staff Branch 叶 
sma 系 代数 树 。 l 图 23-2 关系 代数 树 示 例 
规范 化 


查询 处 理 的 规范 化 阶段 将 查询 转换 成 更 易于 处 理 的 规范 化 的 形式 。 应 用 某 些 转换 规则 
(Jarke and Koch, 1984) 可 以 将 不 管 多 么 复杂 的 谓词 (在 SQL 语句 中 表现 为 WHERE 条 件 表 
达 式 ) 转换 为 下 列 两 种 形式 之 一 : 
e 合 取 范式 : 通过 运算 符 人 (AND) 连接 而 成 的 多 个 合 取 式 的 序列 。 每 一 个 合 取 式 可 
以 包含 一 个 或 者 多 个 通过 运算 符 V (OR) 连接 的 项 。 例 如 : 


(position = ‘Manager’ v salary > 20000) A branchNo = ‘B003’ 


合 取 选 择 仅 包 含 那 些 满足 所 有 合 取 式 的 元 组 。 
o 析 取 范式 : 通过 运算 符 V (OR) 连接 而 成 的 多 个 析 取 式 的 序列 。 每 一 个 析 取 式 可 以 
包含 一 个 或 者 多 个 通过 运算 符 八 (AND) 连接 的 项 。 
例如 ， 可 以 将 上 面 的 合 取 范式 改写 为 : 
(position = ‘Manager’ ^ branchNo = ‘B003’) v (salary > 20000 A^ branchNo = *B003’) 
析 取 选择 包含 了 满足 各 个 析 取 式 的 所 有 元 组 的 并 集 。 
语义 分 析 
语义 分 析 的 目标 是 据 奔 那些 规范 后 结构 有 误 或 者 逻辑 矛盾 的 查询 。 我 们 所 说 的 结构 有 误 
是 指 查询 中 的 某 些 成 分 对 查询 结果 无 任何 影响 ， 此 类 情况 的 发 生 可 能 是 因为 丢失 了 某 些 连接 
说 明 。 而 逻辑 矛盾 是 指 查询 谓词 无 法 被 任何 元 组 满足 。 例 如 ， 关 系 Staff LAVA] ( position= 
‘Manager’ A position= ‘Assistant’) 就 是 矛盾 的 ， 因 为 任何 员工 不 可 能 同时 既是 经 理 又 是 助 
理 。 因 此 ， 可 将 谓词 ((position 三 ‘Manager’ A position= ‘Assistant’ ) V salary>20000 ) 简化 
Žž (salary>20000 )， 因 为 矛盾 的 于 名 可 被 解释 为 FALSE。 遗 憾 的 是 ， 不同 的 DBMS XF JA 
子 句 的 处 理 并 不 一 致 。 
仅 对 那些 不 含 析 取 和 和 否定 运算 的 查询 存在 检验 其 正确 性 的 算法 。 对 于 这 样 的 查询 ， 可 以 
应 用 下 面 的 验证 机 制 : 
(1) 构造 关系 连通 图 ( Wong and Youssefi，1976 )。 如 果 该 图 不 连通 ， 则 说 明 该 查询 结 
构 有 误 。 为 构造 关系 连通 图 ， 我 们 为 每 一 个 基础 关系 创建 一 个 节点 ， 并 且 创 建 一 个 
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节点 表示 最 后 的 结果 关系 ， 知 两 个 关系 进行 连接 运算 ， 对 应 的 两 个 节点 之 间 有 一 条 
边 ， 投 影 运 算 的 源 与 结果 关系 之 间 也 有 一 条 边 。 

(2) 构造 规范 化 属性 连通 图 ( Rosenkrantz and Hunt，1980 )。 如 果 图 中 存在 一 条 权 的 总 
和 为 负 的 环 (cycle)， 则 该 查询 是 矛盾 的 。 为 构造 规范 化 属性 连通 图 ， 为 每 个 属性 
引用 创建 一 个 节点 ， 为 常数 创建 0 节点 。 在 表示 连接 操作 的 两 节点 之 间 和 定义 一 有 向 
W, 在 属性 节点 和 代表 选择 运算 的 常数 0 节点 之 间 定 义 一 有 向 边 。 接 下 来 ， 如 果 边 
a— b 代表 不 等 式 (a 和 b 十 c)， 则 在 其 上 加 权 值 c ; WRH 0 一 a 代表 不 等 式 (atc), 
则 在 其 上 加 权 值 -c。 


| 例 23.2 >> 验证 语义 的 正确 性 
考虑 下 面 的 SQL 查询 : 
SELECT p.propertyNo, p.street 
FROM Client c, Viewing v, PropertyForRent p 


WHERE c.clientNo = v.clientNo AND 
c.maxRent >= 500 AND c.prefType = ‘Flat AND p.ownerNo = ‘CO93’; 


图 23-3a 所 示 的 关系 连接 图 并 不 是 全 连通 的 ， 这 表明 此 查询 存在 结构 错误 。 在 这 个 示例 
中 ， 遗 漏 了 谓词 的 连接 条 件 (v.propertyNo=p.propertyNo) 。 





Wun ot 
Tete 


a) 关系 连接 图 表明 查询 存在 结构 错误 


A 


b) 规范 化 的 属性 连接 图 表明 查询 是 矛盾 的 
图 23-3 





现在 思考 下 面 的 查询 : 


SELECT p.propertyNo, p.street 
FROM Client c, Viewing v, PropertyForRent p 
WHERE c.maxRent > 500 AND c.clientNo = v.clientNo AND 
v.propertyNo = p.propertyNo AND c.prefType = ‘Flat AND c.maxRent = 200; 
该 查询 的 规范 化 属性 连通 图 如 图 23-3b 所 示 ， 在 节点 c.maxRent 和 0 节点 之 间 存 在 一 个 
总 和 为 负 值 的 环 ， 这 表明 此 查询 是 矛盾 的 。 很 明显 ， 客 户 的 租金 不 可 能 既 多 于 500 英镑 又 少 
于 200 英镑 。 OK 


化 简 
化 简 过 程 的 目标 是 检测 元 余 条 件 ， 去 除 公共 的 子 表达 式 ， 将 查询 转换 成 语义 上 等 价 、 更 
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易于 高 效 计 算 的 形式 。 通 常 ， 访 问 限 制 、 视 图 定义 和 完整 性 约束 等 问题 都 在 本 阶段 考虑 ， 它 
们 之 中 有 一 些 也 可 能 引入 元 余 。 如 果 用 户 不 是 对 查询 中 每 个 部 分 都 具有 相应 的 访问 权限 ， 那 
么 查询 将 被 拒绝 执行 。 如 果 用 户 具 有 相应 的 访问 权限 ， 则 对 查询 的 初始 优化 就 是 采用 众 所 周 
知 的 布尔 代数 的 需 等 规则 ， 即 : 


pA (p)=p pv (p)=p 

p ^ false = false p v false = p 

p A true = p p v true = true 

p ^ (~p) = false p v (~ p) = true 

P ^ (p Yq) =p Ppy(p^gq) =p 

例如 ， 考 虑 下 面 的 视图 定义 和 基于 该 视图 的 查询 : 

CREATE VIEW Staff3 AS SELECT * 

SELECT staffNo, fName, IName, salary, branchNo FROM Staff3 

FROM Staff WHERE (branchNo = ‘B003’ AND 
WHERE branchNo = ‘B003’; salary > 20000); 


如 在 7.4.3 节 中 描述 的 那样 ， 经 过 对 视图 的 处 理 ， 最 终 的 查询 将 是 : 

SELECT staffNo, fName, IName, salary, branchNo 

FROM Staff 

WHERE (branchNo = “B003’ AND salary > 20000) AND branchNo = *B003’; 

可 以 将 WHERE 条 件 化 简 为 (branchNo= ‘ B003’ AND salary >20000 )。 

完整 性 约束 也 可 用 于 实现 查询 的 简化 。 例 如 ， 考 虑 下 面 的 完整 性 约束 ,该 约束 保证 只 有 
经 理 的 工资 可 以 高 于 20000 英镑 : 

CREATE ASSERTION OnlyManagerSalaryHigh 

CHECK ((position <> “Manager’ AND salary < 20000) 

OR (position = ‘Manager’ AND salary > 20000)); 

考虑 该 约束 对 下 述 查 询 的 影响 : 

SELECT * 

FROM Staff 

WHERE (position = ‘Manager’ AND salary < 15000); 

WHERE 子 句 中 的 谓词 表示 查找 工资 低 于 15000 英镑 的 经 理 ， 显 然 该 谓词 与 上 面 的 完整 
性 约束 相 矛 盾 ， 因 此 不 存在 满足 该 谓词 的 元 组 。 
查询 重 构 

在 查询 解析 的 最 后 阶段 ， 系 统 将 重 构 查 询 以 便 更 加 高 效 地 实现 查询 。 我 们 将 在 下 一 节 进 
一 步 讨论 查询 的 重 构 。 


23.3 ”查询 优化 的 启发 式 方法 


本 节 将 学 习 查 询 优 化 的 启发 式 方法 ， 启 发 式 方法 是 通过 转换 规则 将 某 一 关系 代数 表达 式 
转换 为 更 加 高 效 的 并 与 之 等 价 的 形式 。 例 如 ， 在 例 23.1 中 我 们 已 经 看 到 ， 在 连接 运算 之 前 
先 执行 选择 运算 比 之 后 执行 要 高 效 得 多 。 在 23.3.1 节 还 将 会 看 到 ， 存 在 这 样 的 转换 规则 ， 即 
允许 改变 连接 和 选择 运算 的 执行 顺序 ， 从 而 可 以 先 执 行 选择 运算 。 在 讨论 了 有 效 的 转换 之 
后 ，23.3.2 节 提 出 了 一 套 能 生成 “好 的 “虽然 未 必 是 最 优 的 ) 执行 策略 的 启发 式 规则 。 
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23.3.1 关系 代数 运算 的 转换 规则 


通过 应 用 转换 规则 ， 优 化 天 可 以 将 一 种 关系 代数 表达 式 转换 为 另 一 种 与 之 等 价 的 并 且 执 
行 效率 更 高 的 表达 式 。 下 面 将 用 这 些 规则 重 构 在 查询 解析 阶段 产生 的 (规范 的 ) 关系 代数 树 。 
这 些 规则 的 正确 性 证 明 可 参见 Aho et al. ( 1979 )。 在 列举 这 些 规则 时 ， 会 用 到 三 个 关系 R、 
SHT, HP R 是 定义 在 属性 集合 A 二 {A!，A;，…，A,} 上 的 关系 ，S 是 定义 在 属性 集合 B= 
{B!，B;,，…，B,} EWK. p, qM rR, L, Lis La, M, Mi, M: 和 N 代表 属性 集 。 
(1) 将 合 取 选择 运算 转换 为 单个 选择 运算 的 串联 执行 (反之 亦 然 ) 
Gpaqar(R) = op(oa(o.(R))) 
此 转换 规则 有 时 也 称 为 串联 式 选择 。 例 如 : 
T branchNo="B003" a salary>15000(Staff) = Obrancho='B003 (O saary>15000(Staff)) 
(2) 选择 运算 的 交换 律 
Op(aa(R) = aaq(ap(R)) 
例如 : 
TbranchNo='B003 (O salary>15000(Staff)) = Orsayary>15000(T branchnNo="B003"(Staff)) 
(3) 一 串 投影 运算 中 只 需 执 行 最 后 一 个 投影 运算 
My. . . IIN(R) = M(R) 
例如 : 
Tame! LranchNo, Name( Staff) = [lvame(Staff) 
(4) 选择 运算 和 投影 运算 的 交换 律 
如 果 谓 词 p 仅 涉及 投影 运算 列 中 的 属性 ， 则 可 以 交换 选择 运算 和 投影 运算 的 执行 次 序 : 
DA) 三 OA Ant 
例如 : 
Time, tName(FiName="Beech'(Staff)) = Ciname='Beech' (Fiame, iName(Staff)) 
(5) 9 连接 (FoSE ILA A) 运算 的 交换 律 
be > = Set R 
RXS=SXR 
因为 等 接 和 自然 连接 是 6 连接 的 特殊 形式 ， 所 以 该 规则 也 适用 于 这 些 连接 运算 。 例 如 ， 
Staff 和 Branch 的 等 接 运算 : 
Staff ><, rpranchNo=BranchbranchNo Branch = Branch Pa spranchNo=Branch branchNo Staff 
(6) 选择 运算 和 8 连接 (或 笛 卡 儿 乘 积 ) 运算 的 交换 律 
如 果 选 择 谓词 仅 涉及 一 个 被 连接 关系 的 属性 ， 则 可 以 交换 选择 运算 和 连接 运算 (或 笛 卡 
儿 乘 积 ) 的 执行 次 序 : 
Op(Req S) = (op(R)) 4, S 
o(RXS5S)=(o(R))XS， PETA, Ay -~ A,} 
或 者 ， 如 果 选 择 谓词 是 形 如 (pAq) 这 样 的 合 取 谓词 ， 其 中 的 p 仅 涉及 R 的 属性 ，q 则 
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仅 涉 及 S 的 属性 ， 则 可 以 交换 选择 运算 和 6 连接 运算 的 执行 次 序 : 
Tp rqRs, 3) 三 (OP(R)) + (oa(>)) 
gpaaR X S) = (Op(R)) X (ad(5)) 
例如 
GTposition='Manager' A city="London’ (Staff P taff branchNo=Branch.branchNo Branch) ys 
US osna inne (Staff) D< ctaffbranchNo= Branch branchNo (T <ty="London'(Branch)) 
(7) 投影 和 6 连接 (或 笛 卡 儿 乘 积 ) 的 交换 律 
如 果 投 影 列 表 形 如 LL==L1UL;， 其 中 是 涉及 R 的 属性 ，L; 是 涉及 S 的 属性 ， 那 么 如 
果 连 接 条 件 仅 包含 了 L 的 属性 ， 则 可 以 交换 投影 运算 和 9 连接 运算 的 执行 次 序 : 
IL, U ly (R o<, S) (II, (R)) a (II,(S)) 
例如 : 


TT position, city, brancho (Staff P< ciaftbranchNo=BranchbranchNe Branch) = 
(TT position, branchNo (Staff)) P< saf branchNNo=BranchbranchNo (ity, brancho (Branch)) 
如 果 连 接 条 件 还 包含 了 L 以 外 的 其 他 属性 ， 假设 属性 集 M 二 M1UM;， 其 中 Mi 是 涉及 
R 的 属性 ，M: 是 涉及 S 的 属性 ， 那 么 最 终 的 投影 运算 必须 是 : 
Th, u o (Ro S) = T, vi, (M, um, (R) 24 (vm, (S)) 
例如 : 
[swon, city( Staff warbandhNo=emndbanchNo Branch) = 
TT position, city (Tposition, brancho( Staff) >s.aftbranchNo=BranchbranchNo (Loiy, brancho (Branch))) 
(8) 并 运算 和 交 运 算 《〈 不 含 集合 差 运算 ) 的 交换 律 
RUS=SUR 
RNS=SNR 
(9) 选择 运算 和 集合 运算 (并 、 交 和 集合 差 运 算 ) 的 交换 律 
Op (RU 5) =o, (S) U Op(R) 
oh (RN 5) = 9, (S) N9,(R) 
os (R= 5) = Oo 一 ON 


(10) 投影 运算 和 并 运算 的 交换 律 
I(R U S) = M(S) U T(R) 
(11) 6 连接 (foH FIL RA) 运算 的 结合 律 
笛 卡 儿 乘 积 和 上 自然 连接 总 是 满足 结合 律 的 : 
(Ros S) oa T = Roa (Soa T) 
(RXS)XT=RX(S XT) 
如 果 连 接 条 件 q 仅 涉及 关系 S 和 T 的 属性， 那么 在 下 列 情况 下 9 连接 仍然 满足 结合 律 : 
(Rog. Sp eq, = Reg. GP D 
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例如 : 


(Staff >< rtstatio=PropertyForRentstafNo PropertyForRent) ><, nernyo=OwnerownerNo a StaffiName=OwneriName OWNEr 


= Staff PE taffstafNo=PropertyForRentstaffNo A Staff.lName=IName (PropertyForRent ownarN6 Owner) 


注意 在 此 例 中 ， 仅 移动 括号 的 位 置 是 不 对 的 ， 因 这 样 会 导致 关系 PropertyForRent 和 
Owner 的 连接 条 件 中 出 现 未 定义 的 引用 〈Staff.IName ): 


PropertyForRent PropertyForRentownerNo=OwnerownerNo A Staff. Name=Owner.INare Owner 
(12) 并 和 交 (不 含 集合 差 ) 运算 的 结合 律 
(RUS) UT=SU(RUT) 
(RNMNS}NT = SN(RN IT) 


Bi 23.3 D 转换 规则 的 应 用 » 
为 有 意 租赁 公寓 的 客户 查找 满足 他 们 要 求 的 、 业 主 为 CO93 的 房产 。 
可 用 SQL 语句 表示 此 查询 : 
SELECT p.propertyNo, p.street 
FROM Client c, Viewing v, PropertyForRent p 
WHERE c.prefType = ‘Flat’ AND c.clientNo = v.clientNo AND 
v.propertyNo = p.propertyNo AND c.maxRent >= p.rent AND 
c.preffype = p.type AND p.ownerNo = ‘CO93’; 
在 此 例 中 ， 我 们 假设 业主 CO93 拥有 的 房产 数目 少 于 想 租用 公寓 的 求 租 者 的 人 数 。 将 该 
SQL 语句 转换 为 关系 代数 ， 得 到 : 


I meet E pstreet 6 ‘Flat’ a cclientNo=v.clientNo a vpropertyNo=p.propertyNo a cmaxRent>=prent A cpreffype=pitype 
A pownerNo='cogs'(C x v) x p)) 


可 以 将 这 个 查询 表示 成 如 图 23-4a 所 示 的 规范 的 关系 代数 树 形 式 。 应 用 下 述 转换 规则 以 
提高 执行 策略 的 效率 : 
(1)(a) 规则 1， 将 选择 运算 的 连接 拆 分 成 一 个 个 独立 的 选择 运算 。 
(b) 规则 2 和 规则 6， 将 选择 运算 重新 排序 ， 然 后 交换 选择 运算 和 笛 卡 儿 乘 积 运算 的 
执行 次 序 。 
前 两 步 的 运算 结果 如 图 23-4b 所 示 。 
(2) 由 5.1.3 节 知 ， 我 们 可 以 将 笛 卡 儿 乘 积 及 其 后 的 相等 谓词 选择 运算 重 写 为 一 个 等 接 
运算 ， 即 : 
Ora=sp(R X S) = Rm pa=sp S 


在 适当 的 地 方 应 用 该 转换 规则 。 这 一 步 的 结果 如 图 23-4c 所 示 。 
(3) 规则 11， 重 新 排序 等 接 运 算 ， 优先 执行 更 严格 的 选择 ( p.ownerNo=‘CO93’), 4 
图 23-4d 所 示 。 
(4) 规则 4 和 规则 7， 将 投影 运算 移 到 等 接 运算 的 下 面 ， 根 据 需 要 创建 新 的 投影 运算 。 
应 用 这 些 规则 的 结果 如 图 23-4e 所 示 。 
对 该 特例 可 进行 的 另 一 个 优化 是 : 将 选择 运算 (c.prefType 二 p.type) 化 简 为 ( p.type= 
Flat )。 因 为 从 第 一 个 谓词 可 以 知道 (c.prefType 二 'Flat')。 通 过 这 个 替换 ， 可 以 将 此 选择 运 
算 放置 到 树 的 底部 ， 化 简 后 的 关系 代数 树 的 结果 如 图 23-4f 所 示 。 Ki 
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[I p.propertyNo, p.street 


Oc maxRent>=p.rent A C.prefType=ptype 


OV.propertyNo=p.propertyNo | 


T p.propertyNo, p.street Oe maxRent>=p.rent A c.prefType=p.type 


7% 


Oc prefType='Flat’ a c.clientNo=v.clientNo ^ Oc.clientNo=v.clientNo Op.ownerNo='CO93 


v.propertyNo=p.propertyNo ^ c.maxRent>=p.rent ^ | \ pt 
c.prefType=p.type a POwnerNo=' CO93 
x P Pte clientNo=v.clientNo 。 GpownerNo=-'CD93， 
/ \ Ocpreflype='Fiat V Ocprettype-Fia’ V P 
/\ i , 
a) 规范 的 关系 代数 树 b) 将 选择 运算 下 移 后 的 关系 代数 树 c) 将 选择 / 笛 卡 儿 乘 积 转换 
为 等 接 后 的 代数 树 
T p propertyNo, p street TI] propertyNo, p.street 
[lp propertyNo, pstreet Oc maxRent>=p.rent a c.preflype=p.type Oc maxRent>=p.rent 
Oc.maxRent>=p.rent a c.preffype=p.type 4c. clientNo=v.clientNo tc. clientNo=v.clientNo 
Dac ctientNo=v.clientNo >4y.propertyNo=p.propertyNo TT cctientNo, cmaxRent DdypropertyNo=p.propertyNo  TleclientNo, cmaxRent 


T ie ie 


per ger Aprviotttio piirest TT v.propertyNo, Oc preftype='Fiat’ tl PpropertyNo, p.street Mh propertyNo, Oc. preftype='Fiat’ 
Op ownerNo='C093' V C Op.ownerNo='CO93" y C Op.ownerNo='CO93' A V C 
/ 
P F P 
d) 使 用 等 接 结合 律 后 的 关系 代数 树 e) 将 投影 运算 下 移 后 的 关系 代数 树 f) 用 c.prefType='Flat' 蔡 换 掉 
p.type 上 的 选择 ， 并 将 选择 下 
移 之 后 最 终 导出 的 关系 代数 树 


图 23-4 例 23.3 的 关系 代数 树 


23.3.2 ”启发 式 处 理 策 略 


很 多 DBMS 在 选择 查询 处 理 的 策略 时 都 采用 启发 式 的 方法 。 本 节 我 们 将 分 析 查 询 处 理 
过 程 中 可 能 会 用 到 的 一 些 比较 好 的 启发 式 规 则 。 
(1) 尽 可 能 早 地 执行 选择 运算 

选择 运算 减少 了 关系 的 基数 ， 从 而 也 就 降低 了 后 面 处 理 该 关系 时 的 复杂 度 。 因 此 ， 可 以 
通过 规则 1 的 使 用 串联 执行 一 串 选 择 运算 ， 然 后 利用 与 选择 运算 相关 的 一 元 、 二 元 运算 的 交 
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换 律 《如 规则 2、 规 则 4、 规则 6 和 规则 9 )， 将 选择 运算 尽 可 能 地 移动 到 关系 代数 树 的 底部 。 
注意 要 将 作用 于 同一 关系 的 选择 谓词 放 在 一 起 。 
(2) 合并 笛 卡 儿 乘 积 与 其 后 的 选择 运算 为 连接 运算 ， 用 选择 运算 的 谓词 表示 连接 条 件 

前 面 曾 提 到 过 ， 可 以 将 一 个 带 有 8 连接 谓词 的 选择 运算 和 一 个 笛 卡 儿 乘 积 运算 重新 改写 
为 一 个 9 连接 运算 : 


Oragsb(R X S) = R araso 9 


(3) 利用 二 元 运算 的 结合 律 对 叶 节 点 重新 排序 ， 先 执行 条 件 最 严格 的 选择 运算 
优化 的 首要 原则 是 在 执行 二 元 运算 之 前 尽 可 能 地 减少 参与 运算 的 关系 的 规模 。 因 此 ， 如 
果 要 执行 两 个 连续 的 连接 运算 : 
(R PaRa osb 9) score T 


那么 可 以 使 用 关于 8 连接 (以 及 并 和 交 运 算 ) 的 结合 律 (如 规则 11 和 规则 12 )， 对 运算 
重新 排序 ， 使 得 产生 较 小 结果 关系 的 连接 优先 执行 ， 因 为 这 意味 着 参与 下 一 个 连接 运算 的 操 
作 数 的 规模 也 较 小 。 
(4) 尽 可 能 早 地 执行 投影 运算 

同样 ， 投 影 运 算 可 以 减少 关系 的 基数 ， 从 而 降低 了 后 面 对 该 关系 处 理 的 复杂 度 。 因 此 ， 
可 以 使 用 规则 3 对 投影 进行 级 联 处 理 ， 使 用 关于 投影 和 二 元 运算 的 交换 律 (如 规则 4、 规 则 
7 和 规则 10 )， 将 投影 运算 尽 可 能 地 移 至 关系 代数 树 的 底部 。 注 意 将 属于 同一 关系 的 投影 属 
性 放 在 一 起 。 
(5) 只 计算 一 次 公共 表达 式 的 值 

如 果 公 共 表 达 式 在 关系 代数 树 中 多 次 出 现 ， 而 且 计 算 结果 的 规模 又 不 是 太 大 的 话 ， 则 在 
第 一 次 计算 之 后 ， 可 以 将 结果 存储 起 来 ， 以 备 后 面 需 要 的 时 候 重用 。 只 有 在 下 列 情况 下 ， 存 
储 公 共 表 达 式 的 计算 结果 的 做 法 才 会 带 来 好 处 : 公共 表达 式 计 算 结果 的 规模 足够 小 到 或 者 可 
以 被 存储 在 主 存储 器 中 ， 或 者 若 被 存储 在 辅助 存储 融 中 ， 则 从 辅 存 读 取 该 结果 的 开销 要 低 于 
重新 计算 的 开销 。 当 对 视图 进行 查询 时 ， 该 策略 显得 尤其 有 用 ， 因 为 每 一 次 构造 视图 时 都 是 
用 同一 个 表达 式 。 

在 25.7 节 中 我 们 将 讨论 如 何 将 启发 式 规则 用 于 分 布 式 查询 。 在 23.6 节 中 还 将 看 到 ， 硅 
想 将 这 些 启发 式 规则 应 用 于 对 象 关 系 DBMS 的 查询 处 理 ， 尚 需 做 进一步 的 考虑 ， 因 为 对 象 
关系 的 DBMS 支持 包含 用 户 自 定义 类 型 和 用 户 自 定义 函数 的 查询 。 


23.4 ”关系 代数 运算 的 代价 估算 


DBMS 可 以 有 多 种 不 同 的 方式 来 实现 关系 代数 运算 。 查 询 优 化 的 目的 就 是 从 中 选择 效率 
最 高 的 那 种 方案 。 为 了 做 到 这 一 点 ，DBMS 采用 公式 来 估算 不 同方 案 的 开销 ， 然 后 选择 其 中 
开销 最 小 的 。 本 节 ， 我 们 将 对 实现 重要 的 关系 代数 运算 的 一 些 不 同 的 选择 方案 进行 分 析 。 对 
每 一 种 方案 我 们 都 将 给 出 其 实现 的 概述 以 及 实现 的 代价 估算 。 查 询 处 理 中 占 主导 地 位 的 开销 
通常 是 磁盘 访问 的 开销 ， 因 为 磁盘 访问 要 比 主 存 访问 慢 得 多 ， 所 以 在 进行 代价 估算 时 ， 仅 考 
虑 磁盘 访问 的 开销 。 每 一 种 估算 的 结果 均 表示 所 需 的 磁盘 块 访问 的 次 数 ， 但 不 包括 最 后 将 结 
果 关 系 写 人 磁盘 的 开销 。 

许多 代价 估算 都 是 基于 关系 的 基数 的 。 由 于 需要 估算 中 间 结 果 关 系 的 基数 ， 因 此 我 们 还 
会 给 出 一 些 关 于 估算 这 些 基 数 的 第 用 方法 。 本 节 首 先 分 析 统计 数据 的 类 型 ，DBMS 将 统计 数 
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据 存 储 在 系统 目录 中 ， 用 于 协助 进行 代价 估算 。 


23.4.1 数据 库 的 统计 信息 


估算 关系 代数 运算 中 间 结 果 的 大 小 和 开销 时 ， 正 确 与 否 的 关键 在 于 DBMS 存储 的 统计 
信息 的 数量 和 即时 性 。 通 常 ， 我 们 期 望 DBMS 在 系统 目录 中 存储 以 下 类 型 的 信息 : 
关于 基本 关系 R 的 统计 信息 
è nTuples(R): KAR 的 元 组 (记录 ) 的 数目 (BER 的 基数 )。 
è bFactor(R): R 的 块 因子 〈 即 一 块 可 以 存储 的 R 元 组 的 个 数 )。 
e nBlocks(R): 存储 关系 R 所 需 的 块 数 。 如 果 R 的 元 组 物理 上 存在 一 起 ， 则 
nBlocks(R) = [nTuples(R)/bFactor(R)] 


[x] 表示 计算 的 结果 被 截断 为 大 于 或 者 等 于 x 的 最 小 整数 。 
关于 基本 关系 R 的 属性 A 
è nDistinct,(R): 属性 A 在 关系 R 中 的 不 同 取 值 的 个 数 。 
è minA(R)，maxA(R): 属性 A 在 关系 R 中 可 能 的 最 小 值 和 最 大 值 。 
e SCA(R) : 属性 A 在 关系 R 中 的 选择 基数 (selection cardinality)。 这 是 满足 属性 A 的 
某 个 等 值 条 件 的 平均 元 组 个 数 。 如 果 假 定 A 的 值 在 R 中 均匀 分 布 ， 且 至 少 有 一 个 值 
满足 条 件 ， 则 : 


l 


hes 


SC,(R) = | 


也 可 以 基于 其 他 条 件 来 估算 选择 基数 : 


[n'Tuples(R)*((max,(R)—c/(max,(R)—min,(R))] ”车 为 不 等 值 比较 A >c 
[nTuples(R)*((c— min,(R))/(max,(R)—min,(R))] ”车 为 不 等 值 比较 A <c 


SC,(R) = ([(n Tuples(R)nDIstinct,(R))*n] 若 查 询 条 件 为 AE {C Ca …, c,} 
SCa(R)*SCa(R) 车 查询 条 件 为 AAB 
SC,(R)+SC,(R)-SC,(R)*SC,(R) 车 查询 条 件 为 AVB 

关于 属性 集 A 上 的 多 级 索引 | 


è nLevelsa(]): I 的 级 数 。 

è nLfBlocksa(I): I 中 叶 的 块 数 。 

要 保持 这 些 统计 数据 的 即时 性 是 很 困难 的 。 如 果 DBMS 每 插入 、 更 新 或 者 删除 一 个 元 
组 的 时 候 就 更 新 一 次 统计 数据 ， 则 在 系统 峰值 的 时 刻 就 会 严重 影响 系统 的 性 能 。 所 以 ， 一 种 
更 可 取 的 方式 是 ，DBMS 周期 性 地 对 统计 信息 进行 更 新 ， 例 如 在 晚上 或 者 系统 空闲 的 任何 时 
候 进 行 。 某 些 系统 还 采取 了 另外 一 种 做 法 ， 即 由 用 户 上 自己 决定 何 时 更 新 统计 数据 。 


23.4.2 选择 运算 


正如 5.1.1 节 所 述 ， 在 关系 R 上 进行 的 关系 代数 的 选择 运算 ( S==o,(R))， 可 以 说 是 定义 
了 男 一 个 关系 S$，S 仅 包 含 R 中 那些 满足 特定 谓词 的 元 组 。 谓 词 可 以 是 简单 谓词 ， 例 如 只 是 
将 R 的 某 一 属性 和 一 个 常量 或 者 男 一 个 属性 的 值 进 行 比较 。 也 可 以 是 包含 多 个 条 件 的 复合 
谓词 ， 这 多 个 条 件 则 是 由 逻辑 连接 符 人 A (AND)、V (OR) 以 及 一 (NOT) 连接 起 来 的 。 选 
择 运 算 有 很 多 不 同 的 实现 策略 ， 具 体 依 赖 于 存储 关系 的 文件 的 结构 和 谓词 中 所 涉及 的 属性 
(组 ) 是 否 被 索引 或 被 散 列 。 主 要 的 策略 有 : 
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© 线性 搜索 (无 序 文件 ， 无 索引 ) 

© 二 分 法 搜索 (有 序 文件 ， 无 索引 ) 
o 散 列 关键 字 上 的 等 值 比较 

o 主 关键 字 上 的 等 值 比较 

o 主 关键 字 上 的 非 等 值 比较 

e RE ( 辅 ) 索引 上 的 等 值 比较 

。 ERE ( 辅 ) 索引 上 的 等 值 比 较 
e B+ 树 辅 索引 上 的 非 等 值 比较 

每 一 种 策略 的 开销 如 表 23-1 所 示 。 


表 23-1 选择 运算 策略 的 MO 代价 估算 概览 
策 K F 销 
线性 搜索 (无 序 文件 ， 无 索引 ) 如 果 是 关键 属性 上 的 等 值 比较 ， 则 为 [nBlocks(R)/2] ; 否则 为 nBlocks(R) 


如 果 是 有 序 属 性 上 的 等 值 比较 ， 车 A 为 R 的 关键 属性 则 为 [log.(nBlocks(R))], 


TEER CAFES, ARI) | A Hog: (nBlocks(R))]-+[SCa(R)/bFactor(R)]~1 


散 列 关键 字 上 的 等 值 比较 1 (假设 无 溢出 ) 

主 关 键 字 上 的 等 值 比较 nLevelsa(I)+1 

主 关键 字 上 的 非 等 值 比较 nLevelsA(D) 十 [nBlocks(R)/2] 

聚集 ( 辅 ) 索引 上 的 等 值 比较 nLevels,a(I)+[SCa(R)/bFactor(R)] 

JERE ( 辅 ) 索引 上 的 等 值 比较 nLevelsa(1)+[SC,(R)] 

Be 树 辅 索 引 上 的 非 等 值 比较 nLevels,(I)+[nLf{Block,(I)/2 +nTuples(R)/2] 
估算 选择 运算 的 基数 


在 考虑 这 些 可 选 策略 之 前 ， 首 先 应 对 R 进行 选择 运算 后 的 结果 关系 S 的 大 小 和 各 属性 
不 同 取 值 的 个 数 做 个 估算 。 通 常情 况 下 ， 精 确 估算 相当 困难 ,但 是 如 果 我 们 基于 这 样 一 种 传 
统 的 简化 了 的 假设 一 一 属性 值 在 它 的 值 域 中 均匀 分 布 并 且 属 性 之 间 相 互 独立 ， 则 可 以 采用 下 
列 估算 方式 : 
nTuples(S) = SC, (R) ”谓词 p 形 如 (A 8 x) 


对 S 中 任何 属性 B (BAA): 


nDistinct,(S)= {nTuples(S) # nTuples(S)<nDistinct,(R)/2 
[(n Tuples(S)+nDistinct,(R))/3]  #nDistinct,(R)/2< 
nTuples(S)<2* nDistinct,(R) 
nDistinct,(R) #nTuples(S)>2*nDistinct,(R) 


如 果 没 有 均匀 分 布 的 前 提 假 设 ， 则 可 能 会 获得 更 为 准确 的 估算 值 ， 但 是 这 需要 用 到 更 为 
详细 的 统计 信息 ， 例 如 柱状 图 和 分 布 步 长 (Piatetsky-Shapiro and Connell，1984 )。 我 们 将 
在 23.6.2 节 简 要 介绍 Oracle 如 何 利用 柱状 图 。 

(1) 线性 搜索 (ARMA, RS) 

如 果 采 用 这 种 策略 ， 则 可 能 有 必要 对 每 一 块 中 的 每 一 个 元 组 进行 扫描 ， 以 判断 其 是 否 满 
足 谓词 ， 其 算法 概要 如 图 23-5 所 示 。 有 时 也 称 该 策略 为 全 表 扫 描 〈full table scan)。 如 果 是 
关键 属性 上 的 等 值 比较 ， 假 设 元 组 在 文件 中 均匀 分 布 ， 那 么 在 找到 满足 查找 条 件 的 元 组 之 前 
平均 要 对 半数 的 块 进行 搜索 ， 因 此 该 搜索 的 代价 估算 是 : 
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[nBlocks(R)/2] 


如 果 是 其 他 搜索 条 件 ， 则 可 能 需要 搜索 整个 文件 ， 因 此 更 一 般 的 代价 估算 是 : 
nBlocks(R) 


HI 

// 线性 查找 

// 谓词 是 查找 关键 字 

1/ 文件 无 序 ， 数 据 块 从 1 顺序 编号 

/返回 的 结果 表 包 含 R 中 所 有 满足 谓词 的 元 组 

HI 

for i= 1 to nBlocks(R) { 1/ 在 每 个 块 上 循环 


block = read_block(R, i); 

for j = 1 to nTuples(block) | // 在 块 i 的 每 个 元 组 上 循环 
让 (block.tuple[j] satisfies predicate) 
then add tuple to result; 





图 23-5 ”线性 搜索 算法 


(2) 二 分 法 搜索 (有 序 文件 ， 无 索引 ) 
如 果 谓 词 形 如 (A 二 x)， 且 文件 在 属性 A 上 有 序 ，A 还 是 关系 R 上 的 关键 属性 ， 那 么 搜 
索 的 代价 佑 算 为 : 


[log, (nBlocks(R))] 
二 分 法 搜索 的 算法 如 图 23-6 所 示 。 更 一 般 的 代价 估算 为 : 


II 
/二 分 查找 
l 谓词 是 查找 关键 字 
// 文件 有 序 ， 按 排序 关键 字 A 的 升序 排列 
/1 文件 占据 nblocks 块 ， 从 1 开始 编号 
/返回 一 个 布尔 变量 (found) 说 明 是 否 发 现 一 个 记录 
/| 与 谓词 和 结果 表 匹 配 (HRA NIE) 
// 
next = 1; last = nBlocks; found = FALSE; keep_searching = TRUE; 
while (last >= 1 and (not found) and (keep_searching)) { 
i = (next + last)/2; 1/ 对 分 查找 空间 
block = read_block(R, i) ; 
if (predicate < ordering_key_field(first_record(block))) 
then /记录 在 查找 空间 的 下 一 半 
last = i — 1; 
else if (predicate > ordering_key_field(last_record(block))) 
then ,NW/ 记 录 在 查找 空间 的 上 一 半 


next =i+ 1; 


else if (check_block_for_predicate(block, predicate, result)) 
then /要 找 的 记录 就 在 该 块 中 
found = TRUE; 


else ERA EAB JL 
keep_searching = FALSE; 





图 23-6 “有 序 文件 上 的 二 分 法 搜索 算法 
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[log, (nBlocks(R))] + [SCA (R)/bFactor(R)] — 1 

第 一 项 表示 使 用 二 分 法 搜索 方法 找到 第 一 个 元 组 的 开销 。 假 设 有 SCA(R) 个 元 素 满足 
谓词 ， 它 们 分 布 在 [SCA(R)/bFactor(R)] 个 块 上 ， 第 一 个 满足 条 件 的 元 组 就 是 在 这 些 块 中 找 
到 的 。 
(3) 散 列 关键 字 上 的 等 值 比较 | 

如 果 属 性 A 是 散 列 关键 字 ， 那 么 我 们 可 以 利用 散 列 算法 计算 出 元 组 的 目标 地 址 。 如 果 
没有 游 出 ， 则 期 望 开销 为 1。 如 果 有 洲 出 ， 则 需要 额外 的 访问 开销 ， 具 体 依 赖 于 溢出 的 数量 
和 人 处理 淤 出 的 方法 。 
(4) 主 关 键 字 上 的 等 值 比较 

如 果 谓 词 涉及 主 关键 字 字 段 上 的 等 值 比较 (A=x)， 那 么 可 以 利用 主 关键 字 索 引 来 检索 
满足 该 条 件 的 那 一 个 元 组 。 这 时 ， 需 要 读 取 的 块 的 个 数 比 需要 访问 的 索引 块 的 个 数 多 1， 即 
代价 估算 值 为 : 


nLevels, (I) + 1 


(5) 主 关键 字 上 的 非 等 值 比较 
如 果 谓 词 包含 了 主 关键 字 字 段 A 上 的 非 等 值 比较 (A<x, A<=x, A>x, A>=x), 
那么 可 以 先 利 用 索引 对 满足 谓词 A=x 的 元 组 进行 定位 。 一 旦 获得 了 该 元 组 的 索引 ， 就 可 以 
通过 访问 该 元 组 前 面 或 者 后 面 所 有 的 元 组 来 获得 满足 查询 条 件 的 元 组 。 假 定 元 组 是 均匀 分 布 
的 ， 则 可 以 期 望 有 一 半 的 元 组 满足 不 等 条 件 ， 所 以 主 关 键 字 上 的 非 等 值 比较 的 代价 估算 为 : 
nLevels,(I) + [nBlocks(R)/2] 


(6) 聚集 (Hi) 索引 上 的 等 值 比较 
如 果 谓 词 为 属性 A 上 的 等 值 比较 ， 而 属性 A 不 是 主 关 键 字 ， 但 在 A 上 却 建立 了 聚集 辅 
索引 ， 则 可 以 利用 该 索引 来 检索 所 需 元 组 ， 代 价 估算 为 : 
nLevels,(I) + [SC,(R)/bFactor(R)] 


第 二 项 是 对 存储 满足 等 值 比 较 条 件 的 元 组 的 块 数 的 估算 ，SCA(R) 表示 满足 条 件 的 元 组 
的 个 数 。 
(7) 非 聚集 ( 辅 ) 索引 上 的 等 值 比较 
如 果 谓 词 涉及 了 属性 A 上 的 等 值 比较 ，A 虽然 不 是 主 关 键 字 ,但 在 A 上 存在 非 聚 集 畏 
索引 ， 则 可 以 利用 索引 来 检索 所 需 元 组 。 这 时 ， 我 们 假定 元 组 位 于 不 同 的 块 上 (此 时 索引 是 
非 聚 集 的 )， 所 以 代价 估算 为 : 
nLevels,(I) + [SC,(R)] 


(8) B’ 树 辅 索引 上 的 非 等 值 比较 
如 果 谓 词 涉及 属性 A 上 的 非 等 值 比 较 (CA<x, A<=x, A>x, A>=x), HEREA 上 
存在 B’* 树 辅 索引 ， 则 可 以 从 树 的 叶 节 点 开始 对 关键 字 的 值 进行 扫描 ， 从 最 小 值 一 直 扫 描 到 
x (对 于 < 和 三 = 条 件 ), 或 者 从 x 开始 扫描 直到 遇 到 最 大 值 (对 于 > 和 > 三 条 件 )。 假 设 元 组 
分 布 均匀 ， 则 可 以 期 望 有 一 半 的 叶 节 点 块 被 访问 到 ， 通 过 索引 ， 有 一 半 的 元 组 被 访问 到 。 所 
以 代价 估算 值 为 : 
nLevels,(I) + [nLfBlocks,(D/2 + nTuples(R)/2] 


利用 Bi 树 索 引 搜 索 单 个 元 组 的 算法 如 图 23-7 所 示 。 
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ll 
I B+ 树 查找 
|| B+ 树 结构 表示 为 一 个 链表 ， 其 每 个 非 叶 节 点 的 结构 为 : 
儿 最 多 有 n 个 元 素 ， 每 个 元 素 由 下 面 的 成 分 组 成 : 
li 一 个 关键 字 值 (key) 和 一 个 指向 子 节点 的 指针 Cp) (可 能 为 NULL ) 
ll 关键 字 排 了 序 : key, <key,<---<key, ， 
// 叶 节 点 指向 实际 记录 的 地 址 
// 谓词 是 查找 关键 字 
ll 返回 一 个 布尔 变量 (found) 说 明 是 否 找到 一 个 记录 和 和 
// 指向 这 个 记录 的 地 址 ( 若 找 到 的 话 ) 
// 
node = get_root_node(); 
while (node is not a leaf node) { 
is i // 找到 比 谓词 小 的 关键 字 
while (not (i > n or predicate < node[ij.key)) { í 
i=i+ l; 
} 
node = get_next_node(nodeli]j.p); /Nodefi].p 指 向 一 棵 子 树 ， 它 可 能 包含 谓词 
1/ 找到 一 个 叶 节 点 ， 检 查 是 否 有 使 谓词 为 真 的 记录 
i=l 
found = FALSE; 
while (not (found or i> n)) | 


if (predicate = node{i].key) 

then { 
found = TRUE; 
return_address = node|i|.p; 





图 23-7 搜索 与 给 定 值 匹 配 的 单个 元 组 的 B’' 树 算法 


(9) 复合 谓词 
SIAR AIL, 我 们 将 讨论 局 限于 仅 涉 及 单个 属性 的 简单 谓词 。 但 是 在 很 多 情况 下 ， 谓词 
可 能 是 复合 的 ,是 由 涉及 多 个 属性 的 多 个 条 件 复合 而 成 的 。 在 23.2 节 中 就 已 经 讲述 了 我 们 
可 以 用 两 种 形式 表示 复合 谓词 一 一 合 取 范式 和 析 取 范式 : 
e 合 取 选择 的 结果 只 包含 那些 满足 所 有 合 取 式 的 元 组 。 
© 析 取 选择 的 结果 则 包含 那些 满足 任何 一 个 析 取 式 的 元 组 的 并 集 。 
不 含 析 取 的 合 取 选 择 。 如 果 复 合 谓词 不 包含 析 取 项 ， 则 可 以 考虑 采用 下 列 方法 : 
e 如 果 在 合 取 中 的 某 一 属性 上 有 索引 或 者 该 属性 是 有 序 的 ， 则 可 以 利用 前 面 讨论 的 选 
择 策略 2 ~ 8 来 检索 出 那些 满足 该 条 件 的 元 组 ， 然 后 验证 这 些 元 组 是 否 满足 谓词 中 
其 余 的 条 件 。 | 
e 如 果 选 择 涉及 两 个 或 多 个 属性 上 的 等 值 比较 ， 并 且 在 这 些 属性 上 存在 组 合 索 引 (或 
散 列 关键 字 )， 则 如 前 所 述 ， 可 以 直接 利用 索引 进行 检索 。 至 于 应 该 使 用 前 面 讲述 的 
哪 一 种 算法 ， 则 由 索引 的 类 型 来 决定 。 
© 如 果 在 一 个 或 多 个 属性 上 定义 了 辅 索引 ， 并 且 这 些 属性 仅 在 谓词 的 等 值 比较 条 件 中 涉 
及 到 ， 那 么 如 果 索 引 使 用 记录 指针 (一 个 记录 指针 唯一 地 标识 一 个 元 组 ， 而 且 提 供 了 
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元 组 在 磁盘 上 的 地 址 ) 而 不 是 块 指 针 ， 我 们 就 可 以 分 别 扫描 每 个 索引 ， 检 索 出 那些 
满足 单个 条 件 的 元 组 。 然 后 求 检 索 所 得 记录 指针 集合 的 交集 ， 这 样 就 找到 了 满足 所 
有 条 件 的 元 组 的 记录 指针 。 如 果 并 不 是 所 有 的 属性 上 都 存在 索引 ， 则 可 以 就 剩余 的 
条 件 对 检索 得 到 的 元 组 再 进行 测试 。 
带 有 析 取 式 的 选择 。 如 果 选 择 条 件 中 的 某 一 项 含有 V (OR) 运算 ， 则 需要 对 该 项 进行 线 
性 搜索 ， 因 为 不 存在 合适 的 索引 或 者 已 排 好 的 序 可 用 ， 也 就 是 说 ， 该 选择 运算 需要 采用 线性 
搜索 法 。 只 有 该 选择 的 每 一 个 项 上 都 存在 索引 或 者 都 有 序 时 ， 我 们 才能 够 对 其 进行 优化 ， 即 
分 别 检索 出 满足 每 一 个 条 件 的 元 组 ， 然 后 进行 合并 运算 求 其 并 集 ， 求 并 集 的 操作 还 可 以 消除 
重复 元 组 ， 详 见 后 面 23.4.5 节 的 讨论 。 同 样 ， 如 果 存 在 记录 指针 的 话 ， 还 可 以 利用 记录 指针 
进行 合并 运算 。 
如 果 没 有 属性 可 用 于 高 效 检索 ， 则 可 以 利用 线性 搜索 法 对 每 一 个 元 组 同时 检测 所 有 条 
件 。 下 面 将 举例 说 明 对 选择 运算 的 估算 。 


| 例 23.4 >» 选择 运算 的 代价 估算 
在 本 例 中 ， 对 于 关系 Sta 任 做 出 如 下 假设 : 
o 主 关 键 字 属 性 staffNo 上 存在 一 个 无 溢出 的 散 列 索引 。 


e 外 部 关键 字 属 性 branchNo 上 存在 聚集 索引 。 

e 属性 salary 上 存在 一 个 B WRG. 

e 在 系统 目录 中 存储 的 与 关系 Staff 有 关 的 统计 数据 为 : 
nTuples(Staff) = 3000 
bFactor(Staff) = 30 =  nBlocks(Staff) = 100 
nDistinct,,...nno(Staff) = 500 => "SC (Staff) = 6 
nDistinct oston(Staff) = 10 = — SC ,oston(Staff) = 300 
nDistinct,,,,,(Staff) = 500 =  SC,,,,(Staff) = 6 
MIN, ,,{Staff) = 10,000 max,,,,,,(Staff) = 50,000 
nLevels,oncnnio(L) = 2 
nLevels.,,,(T) = 2 nLfBlocks,ary(T) = 50 


对 关键 属性 staffNo 进行 线性 搜索 的 代价 估算 为 50 块 ， 对 非 关 键 属性 的 线性 搜索 的 开销 
为 100 块 。 考 虑 下 列 选 择 运 算 ， 通 过 使 用 前 面 的 策略 来 改善 这 两 个 开销 : 

S1: gunNo=scs(Staff) 

S2: Oposton='Manager(Staff) 

33 : ObranchNo="Boos'( Staff) 

S4: Gsiary>20000(Staff) 

S5: o position="Manager’ 人 branchNo="Boos'( Staff) 

Sl: 选择 运算 包含 了 对 主 关 键 字 的 等 值 比较 。 因 此 ， 鉴 于 staffNo 是 散 列 属性 ， 可 以 采用 
前 面 定义 的 策略 3， 其 代价 估算 为 1 块 。 结 果 关 系 的 估计 基数 为 SCsame(Staff) 王 1。 

S2 : 谓词 中 涉及 的 属性 是 非 关 键 字 、 无 索引 的 属性 ， 所 以 无 法 改善 线性 搜索 方法 的 性 
能 ， 估 算 开 销 为 100 块 。 结 果 关 系 的 估计 基数 为 SCposiiion(Staff) 二 300。 

S3 : 谓词 中 的 属性 是 带 有 聚集 索引 的 外 部 关键 字 ， 所 以 可 以 采用 策略 6 进行 代价 估算 ， 
开销 为 2 十 [6/30]=3 块 。 结 果 关 系 的 估计 基数 为 SCbrancnno(Staff) 二 6。 

S4: 该 查询 的 谓词 涉及 对 属性 salary 的 范围 搜索 ， 属 性 salary 上 有 一 个 B WRI, A 
此 可 以 采用 策略 7 进行 估算 ， 开销 为 2+[50/2]+[3000/2]=1527 块 。 但 是 这 个 估 
算 结 果 显 然 要 比 线性 搜索 的 开销 大 得 多 ， 所 以 在 此 采用 线性 搜索 的 方法 。 结 果 关 
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系 的 估计 基数 是 SC catary(Staff) = [3000 X (50000-20000)/(50000-10000)]=2250. 


S5 : 在 最 后 一 个 示例 中 ， 包 含 了 一 个 复合 谓词 ， 但 对 第 二 个 条 件 的 检索 可 以 利用 
branchNo 上 的 聚集 索引 (前面 的 S3) 实现 ， 则 其 代价 估算 为 3 块 。 当 利用 聚集 索引 
检索 出 每 一 个 元 组 时 ， 我们 同时 验证 它 是 否 满足 第 一 个 条 件 (position= ‘Manager’ )。 
我 们 知道 第 二 个 条 件 的 估计 基数 为 SCbrsnenno(Sta 角 二 6， 如 果 将 这 个 中 间 关 系 记 为 
T， 那 么 可 以 估算 position 在 T 中 不 同 取 值 的 个 数 为 [6 十 1073]=6。 现 在 应 用 第 二 个 


条 件 ， 结 果 关 系 的 估计 基数 为 SCposwion(T) 二 6/6 二 1， 如 果 每 个 分 公司 只 有 一 名 经 理 的 


话 ， 这 个 结果 就 是 正确 的 。 


23.4.3 ”连接 运算 


一 。 人 们 尤其 担忧 的 是 连接 运算 (T=(R r S)) 的 执行 性 能 ， 因 为 它 是 除了 笛 卡 儿 乘 积 之 外 
最 为 耗 时 的 运算 ， 所 以 也 是 执行 时 必须 要 保证 尽 可 能 高 效 的 一 种 运算 。 回 顾 5.1.3 节 ，9 连 
接 运 算 定 义 的 关系 是 由 关系 R 和 S 的 笛 卡 儿 乘积 中 满足 特定 谓词 F 的 元 组 构成 的 。 谓 词 F 
形 如 R.a6S.b， 这 里 6 可 以 是 一 个 逻辑 比较 运算 符 。 如 果 谓 词 只 包含 等 号 〈( 三)， 则 这 种 连接 


称 为 等 接 。 本 节 讨 论 实现 连接 运算 的 主要 策略 : 
© KREMET 
© RIMENE 


© 分 类 归并 连接 


© 散 列 连接 


感 兴趣 的 读者 ， 可 以 参考 Mishra and Eich ( 1992) 的 著作 以 更 加 全 面 地 了 解 连 接 策略 。 


不 同 连 接 运 算 策 略 的 代价 估算 如 表 23-2 所 示 。 下 面 从 连接 运算 的 基数 估算 开始 讨论 : 


Rik EVA iE te 


FT| REP ER 


分 类 归并 连接 


散 列 连接 


估算 连接 运算 的 基数 


表 23-2 连接 运算 策略 的 I/O 开销 估算 概览 


开 销 
如 果 缓 冲 区 只 能 缓存 R 和 S 的 一 个 数据 块 ， 则 开销 为 : 
nBlocks(R)+(nBlocks(R)*nBlocks(S)) 
如 果 缓 冲 区 可 以 缓存 R 的 (nBuffer-2) 块 ， 则 开销 为 ; 
nBlocks(R)+[nBlocks(S)*(nBlocks(R)/(nBuffer-2))] 
如 果 R 的 所 有 块 都 能 被 缓存 在 数据 库 缓 冲 区 中 。 则 开销 为 : 
nBlocks(R)+nBlocks(S) 


具体 依赖 于 索引 的 方式 ， 例 如 : WAS 中 的 连接 属性 A 是 主 关键 字 ， 则 开销 为 : 
nBlocks(R)+nTuples(R)*(nLevels,(I)+ 1) 

如 果 属 性 A 有 聚集 索引 I， 则 开销 为 : 
nBlocks(R)-+nTuples(R)*(nLevelsa(1)-+[SC,(R)/bFactor(R)]) 

排序 的 开销 为 : 

nBlocks(R)*[log2(nBlocks(R)]+nBlocks(S)*{log2(nBlocks(S)] 


归并 的 开销 为 : 
nBlocks(R)+nBlocks(S) 


如 果 散 列 索引 缓存 在 内 存 中 ， 则 开销 为 : 

3(nBlocks(R)+nBlocks(S)); 

否则 ， 开 销 为 : 

2(nBlocks(R) + nBlocks(S))*[lognpurer-i(nBlocks(S))—1]+nBlocks(R)+nBlocks(S) 


R、S 的 笛 卡 儿 乘 积 RXS KIERR fh 
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nTuples(R) * nTuples(S) 

遗憾 的 是 ， 要 估算 任何 连接 运算 的 基数 都 很 困难 ， 因 为 它 取决 于 连接 属性 的 值 的 分 布 。 
在 最 坏 的 情况 下 ， 连 接 的 基数 也 不 会 大 于 笛 卡 儿 乘 积 的 基数 ， 所 以 : 

nTuples(T) < nTuples(R) * nTuples(S) 

一 些 系统 就 是 采用 这 个 上 界 。 但 此 估算 结果 过 于 翡 观 。 如 果 假定 在 两 个 关系 中 的 值 的 分 
布 都 是 均匀 的 话 ， 就 可 以 提高 这 个 估算 值 ， 即 带 有 谓词 (R.A=S.B) 的 等 接 的 代价 估算 为 : 

o WR A 是 R 的 关键 属性 ， 那 么 S 的 一 个 元 组 只 能 和 R 的 一 个 元 组 连接 。 因 此 ， 等 接 

的 基数 不 可 能 大 于 S 的 基数 : 
nTuples(T) S nTuples(S) 
o 同样 ， 如 果 B 是 S 的 关键 属性 ， 则 : 
nTuples(T) < nTuples(R) 

e 如 果 A 和 B 都 不 是 关键 属性 ， 则 连接 的 基数 可 以 估算 为 : 

nTuples(T) = SC, (R)*nTuples(S) 
或 者 为 
nTuples(T) = SC, (S)*nTuples(R) 

第 一 个 估算 式 基 于 这 样 一 个 事实 : 在 连接 中 ， 对 于 S 中 的 任意 元 组 s 来 说 ， 平 均 只 能 和 
属性 A 为 某 一 取 值 的 SCA(R) 个 元 组 进行 连接 ， 即 最 多 能 生成 连接 结果 中 的 SCAR) 个 元 组 。 
青 把 这 个 数 和 S 的 元 组 数 相 乘 ， 就 得 到 了 第 一 个 估算 公式 。 以 此 类 推 ， 得 到 第 二 个 估算 式 。 
(1) RREBMER 

最 简单 的 连接 算法 是 谍 套 循环 : 每 次 从 两 个 关系 中 各 取 一 个 元 组 进行 连接 。 外 循环 在 关 
系 R 的 每 一 个 元 组 上 和 迭代， 内 循环 则 在 第 二 个 关系 S 的 元 组 上 和 迭代。 可 是 ， 我们 知道 读 / 写 
操作 的 基本 单位 是 一 个 磁盘 块 ， 因 此 只 要 增加 两 个 块 处 理 的 循环 ， 就 可 以 改进 这 个 算法 。 算 
法 的 主要 内 容 如 图 23-8 所 示 。 

fi 
I RREGHEE 
// 两 个 文件 中 的 块 都 从 1 顺序 编号 


// 返回 的 结果 表 包 含 R 与 S 的 连接 结果 
I 


for iblock = 1 to nBlocks(R) { 
Rblock = read_block(R, iblock); 
for jblock = 1 to nBlocks(S) { 
Sblock = read_block(S, jblock); 


for i= 1 to nTuples(Rblock) { 
for j = 1 to nTuples(Sblock) { 
if (Rblock.tuple[i]/Sblock.tuple|j] match join condition) 
then add them to result; 





图 23-8 Shim gee AY 
因为 需要 对 R 的 每 一 块 进行 读 取 操作 ， 而 且 每 读 取 R 的 一 个 块 就 要 读 取 S 的 所 有 块 ， 
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所 以 藤 套 循环 法 的 代价 估算 为 : 
nBlocks(R) + (nBlocks(R) * nBlocks(S)) 


”对 于 上 述 估算 式 ， 第 二 项 是 固定 的 ， 而 第 一 项 则 取决 于 选择 哪 一 个 关系 作为 循环 的 外 关 
系 。 显 然 ， 应 该 选择 块 数 较 少 的 关系 作为 外 关系 。 

对 该 策略 的 一 个 改进 为 : 为 循环 的 内 关系 和 结果 关系 各 保留 一 个 数据 块 后 ， 把 尽 可 能 多 
的 较 小 关系 (假设 为 R) 的 数据 块 读 取 到 数据 库 缓冲 区 中 。 如 果 缓 冲 区 能 有 nBuffer KR, Af 
么 可 以 一 次 将 及 的 (CnBuffer-2 ) RAIS 的 1 块 读 取 到 缓冲 区 中 。 对 R 的 读 取 的 总 块 数 仍然 
是 nBlocks(R)， 但 要 读 取 的 S 的 块 数 就 减少 为 JR 通过 
这 种 改进 ， 新 的 代价 估算 为 : 

nBlocks(R) + [nBlocks(S)*(nBlocks(R)/(nBuffer 一 2))] 
如 果 可 以 将 R 的 所 有 数据 块 都 读 取 到 缓冲 区 中 ， 则 开销 减少 为 : 
nBlocks(R) + nBlocks(S) 

如 果 等 接 (或 者 自然 连接 ) 中 的 连接 属性 是 循环 内 关系 上 的 关键 字 ， 则 一 旦 找到 第 一 个 
匹配 值 ， 内 循环 就 可 以 终止 。 
(2) 索引 藤 套 循环 连接 

如 果 内 关系 的 连接 属性 上 存在 索引 (或 者 散 列 也 数 )， 则 可 以 用 索引 查询 来 取代 低 效 的 
文件 扫描 。 对 R 的 每 一 个 元 组 ， 可 以 利用 索引 来 检索 S 中 与 该 元 组 匹配 的 元 组 。 索 引 通 套 
循环 连接 算法 的 概览 图 如 图 23-9 所 示 。 为 了 清晰 起 见 ， 我 们 对 外 层 循环 来 用 了 一 次 处 理 一 
块 的 人 简化 算法 。 但 是 如 前 所 述 ， 读 取 RAY, 我们 应 该 将 尽 可 能 多 的 块 读 到 数据 库 缓 冲 区 中 。 
对 此 算法 的 改进 留 作 练 习 ， 请 读者 完成 (见习 题 23.19 )。 


Il 
/1R 与 S 在 连接 属性 A 上 的 索引 块 循环 连接 
/假设 关 系 $ 在 属性 A 上 建 有 索引 并 且 
/针对 元 组 索引 值 R[i.A 有 m 个 索引 项 IIH]，I2]，…，I[ml 
/及 中 的 块 从 1 上 顺序 编号 
// 返 回 的 结果 表 包 含 R 与 S 的 连接 结果 
Íl 
for iblock = 1 to nBlocks(R) { 
Rblock = read_block(R, iblock); 
for i= 1 to nTuples(Rblock) { 


for j=1tom { 
if (Rblock.tuple[i].A = I{j]) 
then add corresponding tuples to result; 





图 23-9 索引 其 套 循环 连接 算法 


索引 其 套 循 环 连接 算法 是 一 个 相对 比较 高 效 的 连接 算法 ， 避 免 了 像 R 和 8S 的 笛 卡 儿 乘 
积 那 样 的 遍历 。 对 R 的 扫描 开销 和 前 面 一 样 ， 还 是 nBlocks(R)， 但 在 S 中 检索 匹配 元 组 的 
代价 却 取决 于 索引 的 类 型 和 相 匹 配 元 组 的 个 数 。 例 如 ， 如 果 S 中 的 连接 属性 A 是 主 关 键 字 ， 
则 代价 估算 为 : 


nBlocks(R) + nTuples(R)*(nLevels, (I) + 1) 
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如 果 S 的 连接 属性 A 上 存在 聚集 索引 ， 则 代价 估算 为 : 
nBlocks(R) + nTuples(R)*(nLevels, (1) + [SC, (R)/bFactor(R)]) 
(3) 分 类 归并 连接 
对 于 等 接 ， 当 两 个 关系 都 在 连接 属性 上 已 排序 时 ， 连 接 的 执行 效率 是 最 高 的 。 在 这 种 情 
况 下 ， 可 以 通过 对 这 两 个 关系 的 归并 来 寻找 R 和 S 中 满足 条 件 的 元 组 。 如 果 RR、S 不 是 已 经 
排序 的 ， 则 可 以 先 执行 一 个 预 处 理 步 又， 对 其 进行 排序 。 因 此 我 们 认为 关系 是 已 排序 的 ， 具 
有 相同 连接 属性 值 的 元 组 一 定 是 连续 的 。 如 果 假 定 连 接 是 多 对 多 的 ， 即 R 和 S 中 的 多 个 元 
组 在 连接 属性 上 都 具有 相同 的 值 ， 并 且 如 果 假 设 每 一 组 具有 相同 连接 属性 值 的 元 组 都 能 被 同 
时 缓存 在 数据 库 缓冲 区 中 ， 则 每 一 个 关系 的 每 一 块 只 需要 被 读 取 一 次 即 可 。 因 此 ， 分 类 归并 
连接 的 代价 估算 是 : 
nBlocks(R) + nBlocks(S) 


如 果 需 要 先 对 关系 进行 排序 的 话 ( 假 设 为 R)， 还 必须 加 上 排序 的 开销 ， 排 序 的 开销 大 致 
可 以 估算 为 : 
nBlocks(R)* [log, (nBlocks(R))] 


分 类 归并 连接 算法 如 图 23-10 所 示 。 


H 
// 了 及 与 S 在 连接 属性 A 上 的 分 类 归并 连接 
/算法 假设 连接 是 多 对 多 的 
/为 简单 起 见 省 略 了 读 
I 首先 排 序 R 和 S ( 若 两 个 文件 已 按 连 接 关键 字 排序 则 不 需 再 做 此 步 ) 
sort(R); 
sort(S); 
1/ 现 在 进行 归并 
nextR = 1; nextS = 1; 
while (nextR <= nTuples(R) and nextS <= nTuples(S)) | 
join_value = R.tuples{nextR].A; 
/扫描 S 直 到 发 现 一 个 小 于 当前 连接 值 的 值 
while (S.tuples[nextS].A < join_value and nextS <= nTuples(S)) | 
nextS = nextS + 1; 
} 
// 可 能 有 R 与 S$ 能 匹配 的 元 组 
儿 对 S 中 每 个 带 join_value 的 元 组 与 R 中 每 个 带 join_value 的 元 组 匹配 
/假设 M:N 连 接 
while (S.tuples[nextS].A = join_value and nextS <= nTuples(S)) { 
m = nextR; 
while (R.tuples[m].A = join_value and m <= nTuples(R)) { 
add matching tuples S.tuples[nextS] and R.tuples[m] to result; 
m=m-+ 1; 
| 


nextS = nextS + 1; 


} 
1// 至 此 找到 了 R 与 5 中 所 有 带 同样 join_value 的 可 匹配 元 组 
1/ 现 在 找 R 中 带 不 同 join_value 的 下 一 元 组 
while (R.tuples[nextR].A = join_value and nextR <= nTuples(R)) { 
nextR = nextR + 1; 





图 23-10 分 类 归并 连接 算法 
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(4) 散 列 连接 

对 于 自然 连接 (或 者 等 接 )， 散 列 连接 算法 也 可 以 用 于 计算 关系 R 和 S 在 连接 属性 A 上 
的 连接 。 算 法 的 思想 是 : 用 某 一 种 散 列 郴 数 对 关系 R A S 进行 划分 ( partition), A) PB 
具有 均匀 性 和 随机 性 。R 和 S 的 每 一 个 等 价 划分 在 连接 属性 上 的 值 都 应 该 是 相同 的 ， 尽 管 有 
时 也 可 能 会 包含 多 个 值 。 因 此， 算法 只 要 验证 等 价 划 分 中 是 否 具 有 相等 的 值 就 可 以 了 。 例 
W, WR RT PHA h0 将 关系 及 分解 为 Ri，Rz2，…，Rw， 将 关系 S 分 解 为 S1，S，，…，Sw， 
则 如 果 B 和 C 分 别 是 R 和 SS 的 属性 ， 且 h(R.B) 关 h(S.C)， 则 R.B 关 S.C。 但 是 ， 如 果 h(R.B)= 
h(S.C)， 则 并 不 意味 着 R.B 王 S.C， 因 为 不 同 的 值 可 能 会 被 映射 到 相同 的 散 列 值 上 。 

第 二 个 阶段 被 称 为 探查 阶段 ， 依 次 读 取 R 的 每 一 个 划分 ， 并 试图 将 该 划分 内 的 元 组 与 S 
中 对 等 划分 中 的 元 组 进行 连接 。 如 果 在 第 二 阶段 采用 符 套 循环 连接 算法 ， 则 将 较 小 的 划分 作 
为 外 层 循环 ,假设 为 Ri。 将 整个 划分 Ri 读 和 内存， 然后 读 取 对 等 划分 S; 中 的 每 一 块 ， 用 5; 
的 每 一 个 元 组 对 R 进行 探查 ， 以 寻找 匹配 元 组 。 为 了 提高 效率 ， 通 常 要 用 另外 一 个 散 列 明 
数 为 每 一 个 划分 Ri 构造 一 个 内 存 散 列表 ， 这 个 散 列 函数 与 原来 那个 划分 散 列 函数 不 同 。 散 
列 连接 算法 如 图 23-11 所 示 。 散 列 连 接 的 代价 估算 为 : 

3(nBlocks(R) + nBlocks(S)) 


I 
li AE Be HK 
1// 为 简单 起 见 省 略 了 读 
II 
/首先 散 列 《分 区 ) RES 
for i= 1 to nTuples(R) | 
hash_value = hash_function(R.tuple|i}.A); 


add tuple R.tuple|i|.A to the R partition corresponding to hash value, hash_value; 


for j = 1 to nTuples(S) | 
hash_value = hash_function(S.tuple[j].A); 
add tuple S.tuple|j].A to the S partition corresponding to hash value, hash_value; 
| 
/下面 进行 探查 (匹配 ) 阶段 
for ihash = 1 toM | 
read R partition corresponding to hash value ihash; 
RP = Rpartition|ihash}; 
for i= 1 to max_tuples_in_R_partition(RP) | 
儿 用 hash_function2() 构 造 一 个 内 存 散 列 索引 ， 该 函数 不 同 于 hash_function() 
new_hash = hash_function2(RP.tuple|i].A); 
add new_hash to in-memory hash index; 
| 
1// 扫 描 S 的 分 区 找 能 匹配 R 的 元 组 
SP = Spartition|ihash}; 
for j= 1 to max_tuples_in_S_partition(SP) | 
read § and probe hash table using hash_function2(SP.tuple|j|.A); 
add all matching tuples to output; 
| 


clear hash table to Prepare for next Partition; 





| 
23-11 散 列 连接 算法 
这 个 开销 包括 划分 R 和 S 时 的 读 开 销 、 写 划分 到 磁盘 的 写 开 销 ， 以 及 后 来 寻找 匹配 元 


HI3F EHAE 545 


组 时 再 次 读 取 R 和 S 每 一 个 划分 的 读 开销 。 这 个 估算 是 一 个 近似 值 ， 因 为 没有 考虑 划分 时 
的 溢出 。 同 时 我 们 也 假定 散 列 索引 可 以 被 缓存 在 内 存 中 。 如 果 不 是 这 样 ， 关 系 的 划分 就 不 可 
能 一 趋 扫 描 完 成 ， 而 要 采用 和 迭代 的 划分 算法 。 此 时 ， 总 的 代价 估算 就 是 : 
2(nBlocks(R) + nBlocks(S))*[log,puger_1 (nBlocks(S)) — 1] 
+ nBlocks(R) + nBlocks(S) 
关于 散 列 连接 算法 更 完整 的 讨论 ， 感 兴趣 的 读者 可 以 参考 Valduriez and Gardarin ( 1984 )、 
DeWitt et al. ( 1984 ) 和 DeWitt and Gerber ( 1985 ) 。 算 法 后 来 被 进一步 地 扩展 ， 包 括 混合 散 
列 连接 ， 参 见 Shapiro (1986 )， 而 Davison and Graefe (1994) 更 新 的 研究 则 描述 了 可 适 配 
可 用 内 存 的 散 列 连接 技术 。 


| 例 23.5 D) 连接 运算 的 代价 估算 
在 本 例 中 ， 有 如 下 假设 : 
o 基于 关系 Sta 任 的 主 关键 字 属 性 staffNo 和 关系 Branch 的 主 关 键 字 属性 branchNo 分 
别 建 立 了 无 海 出 的 散 列 索引 。 
© 有 100 个 数据 库 缓 冲 区 块 可 用 。 
e 系统 目录 存储 了 下 列 统计 数据 : 


nTuples(Staff) = 6000 

bFactor(Staff) = 30 =  nBlocks(Staff) = 200 
nTuples(Branch) = 500 

bFactor(Branch) = 50 =  nBlocks(Branch) = 10 
nTuples(PropertyForRent) = 100,000 

bFactor(PropertyForRent) = 50 =  nBlocks(PropertyForRent) = 2000 


K 23-3 比较 了 前 述 四 种 不 同 策略 用 于 下 面 两 个 连接 操作 时 的 开销 。 
Jl: Staff ><, PropertyForRent 
J2: Branch ®™ sancho PropertyForRent 
对 于 这 两 个 连接 ， 结 果 关 系 的 基数 都 不 可 能 大 于 第 二 个 关系 的 基数 ， 因 为 连接 属性 是 第 
一 个 关系 的 主 关键 字 。 注 意 ， 没 有 任何 一 种 策略 同时 最 适用 于 这 两 个 示例 。 如 果 两 个 关系 都 


已 排序 ， 则 最 适用 于 第 一 个 连接 运算 的 是 分 类 归并 连接 ， 而 最 适用 于 第 二 个 连接 运算 的 是 索 
引 艇 套 循环 连接 。 


表 23-3 例 23.5 中 的 连接 运算 的 1/O 开销 估算 


在 缓存 区 中 分 别 为 R 和 S 分 配 1 PSK 
块 嵌 套 循环 连接 在 缓存 区 中 为 R 分 配 (nBuffer-2 ) 个 志 
R 的 所 有 块 都 被 缓存 在 数据 库 缓冲 区 中 
索引 嵌 套 循环 连接 510 散 列 关键 字 
分 类 归并 连接 
散 列 连 接 散 列 表 被 缓存 在 内 存 中 


O R 的 所 有 块 都 能 同时 读 入 缓冲 区 中 。 
加 不 能 把 R 的 所 有 块 都 同时 读 入 弹 冲 区 中 。 « 
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23.44 ”投影 运算 


投影 运算 (3= IIA man R) 也 是 一 种 一 元 运算 ， 它 定义 的 关系 $ 是 从 R 中 抽取 了 
茶 些 特定 属性 的 值 并 消除 了 重复 值 以 后 得 到 的 关系 及 的 垂直 子 集 。 因 此 ， 要 完成 投影 运算 ， 
需要 完成 下 列 步骤 : 

(1) 去 除 不 需要 的 属性 。 

(2) 从 上 一 步 的 结果 关系 中 去 除 重复 元 组 。 

第 二 步 实 现 起 来 比较 麻烦 ， 尽 管 只 有 在 投影 属性 没有 包含 关系 的 关键 属性 的 情况 下 才 需 
要 执行 。 消 除 重复 元 组 有 两 种 主要 方法 : 排序 和 散 列 。 在 介绍 这 两 种 方法 之 前 ， 先 来 估算 一 
下 结果 关系 的 基数 。 
估算 投影 运算 的 基数 

如 果 投 影 包含 了 一 个 关键 属性 ， 则 由 于 不 需要 去 除 重复 元 组 ， 所 以 投影 的 基数 为 : 

nTuples(S) = nTuples(R) 
如 果 仅 在 一 个 非 关 键 属性 上 投影 (S= IIA(R))， 则 投影 的 估算 基数 为 : 
nTuples(S) = nDistinct,(R) 
否则 ， 假 定 关系 是 属性 值 的 笛 卡 儿 乘 积 〈 通 常 是 不 现实 的 )， 则 基数 估算 为 : 
nTuples(S) < min(nTuples(R) i nDistinct, (R)) 

(1) 利用 排序 去 除 重复 元 组 

这 种 方法 的 目标 是 将 剩 下 来 的 属性 作为 排序 关键 字 对 简化 后 的 关系 中 的 元 组 进行 排序 。 这 
样 做 的 结果 是 将 重复 的 元 组 集中 在 一 起 ， 然 后 就 能 轻易 地 去 除 重复 元 组 了 。 为 了 去 除 不 需要 的 
属性 ， 首 先 需要 读 取 R 的 所 有 元 组， 然后 将 所 需 的 属性 复制 到 一 个 临时 关系 中 ， 这 一 步 的 开 
销 为 nBlocks(R)。 排 序 的 代价 估算 为 nBlocks(R)*[logz(nBlocks(R))]， 则 合 在 一 起 的 总 开销 为 : 

nBlocks(R) + nBlocks(R)*[log,(nBlocks(R))] 

利用 排序 去 除 重 复元 组 的 算法 如 图 23-12 所 示 。 
(2) 利用 散 列 去 除 重复 元 组 

如 果 缓 冲 区 的 块 数 相对 于 关系 R 的 块 数 来 说 较 大 的 话 ， 则 用 散 列 的 方法 会 比较 有 效 。 
利用 散 列 去 除 重复 元 组 分 为 两 个 阶段 : 划分 和 去 重 。 

在 划分 阶段 ， 分 配 一 个 缓冲 区 块 用 于 读 取 关 系 R 的 元 组 ，( nBuffer-1 ) 个 块 用 于 缓存 划 
分 结果 。 对 于 及 的 每 个 元 组 ， 首 先 把 不 需要 的 属性 去 掉 ， 然 后 将 散 列 函数 h 作用 于 剩余 的 
属性 集合 ， 按 散 列 值 将 简化 后 的 元 组 写 到 对 应 缓冲 块 。 应 该 精心 挑选 散 列 函数 h， 以 便 元 组 
能 够 均匀 地 分 布 到 (nBuffer-1l ) 个 划分 中 。 属 于 不 同 划分 的 两 个 元 组 一 定 不 是 重复 元 组 ， 因 
为 它们 具有 不 同 的 散 列 值 ， 这 样 一 来 ， 去 除 重复 元 组 所 要 搜索 的 范围 就 缩小 到 每 个 划分 的 范 
围 了 7。 第 二 阶段 的 工作 如 下 进行 : 

e 依次 读 取 (nBuffer-1 ) 个 划分 。 

e 当 读 取 每 一 个 元 组 时 应 用 男 一 个 (不同 的 ) 散 列 函数 h2()。 

e 将 计算 后 的 散 列 值 插入 位 于 内 存 中 的 一 个 散 列 表 。 

e 如 果 该 元 组 和 其 他 元 组 的 散 列 值 相 同 ， 则 检查 二 者 是 否 为 重复 元 组 ， 若 是 ， 则 删除 

后 面 的 那个 元 组 。 
© 一 旦 处 理 完 一 个 划分 ， 就 将 散 列 表 中 的 元 组 写 入 结果 文件 。 
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lf 
/利用 排序 的 投影 算法 
1 假设 将 关系 R 投 影 到 属性 a , a,,…, a, 
// 返回 结果 关系 S 
Hi 
l 首先 去 掉 不 要 的 属性 
for iblock = 1 to nBlocks(R) { 
block = read_block(R, iblock); 
for i= 1 to nTuples(block) | 


copy block.tuple{i].a,, block.tuple[i].aj, ..., block.tuple[i].a,,, to output T 


| 
/1 如果 必要 下 面 排序 T 
if {ai, ay, ..., âm} contains a key 
then 
$= T; 
else | 
sort(T); 
/最 后 去 掉 重 复 
1= 1;j=2; 
while (i <= nTuples(T)) { 
output T[i] to S; 
/1 如 果菜 个 元 组 重复 ， 则 跳 过 重复 的 
while (T{i] = T{j]) į 
j=jths 





图 23-12 利用 排序 的 投影 算法 


如 果 在 去 除 重复 元 组 之 前 ， 用 来 存放 R 的 投影 运算 结果 的 临时 表 需 要 nb 个 块 ， 则 估算 
的 开销 为 : 
nBlocks(R) + nb 


上 面 的 结果 不 包括 写 结 果 关 系 的 开销 ， 同 时 假定 散 列 划分 无 溢出 。 我 们 将 此 算法 的 改进 
作为 习题 留 给 读者 。 


2345 ”关系 代数 的 集合 运算 


二 元 集合 运算 一 合并 (RUS)、 相 交 (RNS) 和 集合 差 (R-S) 仅 适 用 于 并 集 相 容 的 关 
系 (参见 5.1.2 节 )。 这 些 运算 的 实现 ， 可 以 先 基 于 相同 的 属性 对 两 个 关系 排序 ， 然 后 经 过 对 
这 两 个 已 排序 的 关系 的 一 遍 扫描 就 可 以 得 到 我 们 想 要 的 结果 。 比 如 对 于 合并 运算 ， 就 是 将 无 
论 在 哪个 原始 关系 中 出 现 的 元 组 都 放 入 结果 关系 中 ， 必 要 时 去 除 重复 元 组 。 对 于 相交 运算 ， 
只 将 同时 出 现在 两 个 原始 关系 中 的 元 组 放 人 结果 关系 中 。 至 于 集合 差 运算 ， 查 看 R 的 每 一 
个 元 组 ， 如 果 它 没有 在 S 中 出 现 ， 则 放 人 结果 关系 。 对 所 有 这 些 二 元 运算 ， 我 们 都 可 以 按照 
分 类 归并 连接 算法 的 思路 为 其 构造 实现 算法 。 这 些 二 元 运算 的 代价 估算 比较 简单 : 


nBlocks(R) + nBlocks(S) + nBlocks(R)*[logs (nBlocks(R))] 
+ nBlocks(S)*[log, (nBlocks(S))] 
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我 们 还 可 以 采用 散 列 算法 来 实现 这 些 运算 。 例 如 ， 对 于 合并 运算 ， 可 以 构造 一 个 驻 于 内 
存 的 R 上 的 散 列 索引 ， 然 后 将 未 出 现在 散 列 表 中 的 S 的 元 组 加 入 散 列 索引 。 最 后 ， 将 散 列 
索引 中 的 元 组 写 入 结果 关系 。 
估算 集合 运算 的 基数 

因为 在 执行 合并 运算 时 会 出 现 重复 元 组 ， 所 以 通常 很 难 对 合并 运算 的 基数 进行 估算 ,但 
是 我 们 还 是 可 以 给 出 其 上 限 和 下 限 : | 

max(nTuples(R), nTuples(S)) < nTuples(T) < nTuples(R) + nTuples(S) 

对 于 集合 差 ， 也 可 以 给 出 上 限 和 下 限 : 

0< nTuples(T) < nTuples(R) 


考虑 下 列 SQL 语句 ， 该 语句 查找 员工 的 平均 工资 : 

SELECT AVG(salay) 

FROM Staff; 

该 查询 语句 用 到 了 聚集 函数 AVG。 为 了 实现 这 个 查询 ， 可 以 扫描 整个 Staff KA, FMR 
存 扫 描 时 读 入 的 元 组 的 个 数 和 全 部 工资 的 总 和 。 扫 描 结 束 时 ， 根 据 这 两 个 运行 得 到 的 和 就 很 
容易 计算 出 平均 工资 。 

考虑 下 面 这 个 SQL 查询 ， 该 语句 用 来 查找 每 一 个 分 公司 员工 的 平均 工资 : 

SELECT AVG(salary) 


FROM Staff 
GROUP BY branchNo; 


该 查询 也 用 到 了 聚集 函数 AVG， 但 其 中 多 了 一 个 分 组 子 句 。 对 于 分 组 查询 的 实现 ， 我 
们 可 以 采用 与 去 除 重复 元 组 相似 的 方式 ， 即 排序 或 者 散 列 算法 。 如 果 用 前 面 选择 运算 的 估 
算 值 对 分 组 进行 估算 ， 我们 就 可 以 估算 出 结果 关系 的 基数 。 具 体 的 代价 估算 留 给 读者 作为 
练习 。 


23.5 其 他 可 选 的 执行 策略 


决定 查询 优化 效率 的 主要 因素 之 一 是 所 有 可 能 的 执行 策略 构成 的 搜索 空间 的 大 小 ， 另 一 
个 是 选择 哪 一 种 枚 举 算法 来 搜索 该 空间 以 寻找 最 优 策略 。 对 于 一 个 给 定 的 查询 ， 搜 索 空间 可 
能 非常 大 。 例 如 ， 对 于 由 R、S、T 三 个 关系 的 连接 构成 的 查询 来 说 ， 就 有 十 三 种 不 同 的 连 
接 次 序 : 

Roa (S > T) Roa (F S) (ST) R (T S) R 

SP4 (Roa T) Sm (T >a R) (Res T) mS (Tea R) eS 

Tea (Ro) T (SPR) (Roa S) >a T (S < R) oT 


通常 ， 对 于 nn 个 关系 来 说 ， 有 (2(n-1))!/(n-1)! 种 不 同 的 连接 次 序 。 如 果 n 较 小 ， 该 
搜索 空间 还 比较 容易 处 理 ,， 但是， 随 着 n 的 增加 ， 这 个 数字 会 变 得 异乎 寻常 地 大 。 比 如 ， 
#i n=4, Wil (2(n-1))'(n-1)!=120 ; # n=6, W) (2(n-1))!(n-1)!=30240 ; 车 n= 二 8， 则 为 
17000000 种 ; 若 z=10， 则 超过 176000000000 种 。 使 问题 更 严重 的 是 ， 优 化 器 还 需要 考虑 
各 种 不 同 的 选择 方法 〈 比 如， 线性 搜索 、 基 于 索引 的 搜索 ) 和 连接 方法 (比如 ， 分 类 归并 连 
接 、 散 列 连 接 等 )。 本 节 就 将 讨论 如 何 缩小 搜索 空间 以 及 如 何 有 效 地 实现 遍历 。 我 们 先 分 析 
与 之 相关 的 两 个 问题 : 流水 线 和 线性 树 。 
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23.5.1 流水 线 


本 市 进一步 讨论 经 常用 以 提高 查询 性 能 的 技术 ， 即 流水 线 (pipelining)， 有 时 也 被 称 
为 基于 流 的 处 理 ( stream-based processing) 或 者 即时 处 理 ( on-the-fly processing), Æ H 
前 的 讨论 中 ， 我 们 一 直 假 设 关 系 代 数 运算 的 中 间 结 果 被 临时 写 和 人 磁盘。 这 个 过 程 被 称 为 物 
化 ( materialization): 即 一 个 运算 的 结果 被 存放 在 临时 关系 中 ， 以 待 下 一 个 运算 处 理 。 男 
一 种 方法 就 是 将 一 个 运算 的 结果 直接 流水 送 入 下 一 个 运算 中 ， 而 不 必 创 建 临时 关系 来 保存 
中 间 结 果 。 显 然 ， 如 果 采 用 流水 线 技术 ， 则 可 以 节省 创建 临时 关系 和 重新 读 取 中 间 结 果 的 
开销 。 

例如 ， 在 23.4.2 节 的 最 后 ， 我 们 讨论 了 含有 复合 谓词 的 选择 运算 的 实现 ， 例 如 : 


T position="Manager' A salary>20000( Staff) 


在 假设 属性 salary 上 存在 索引 ， 则 可 以 使 用 串联 选择 规则 将 该 选择 转换 为 两 个 运算 : 


T position ="Manager’ (Taans eoooo( Staff) ) 


现在 ， 可 以 利用 索引 有 效 地 处 理 salary 上 的 第 一 个 选择 运算 ， 将 结果 存放 在 一 个 临时 关 
系 中 ， 然 后 对 临时 关系 执行 第 二 个 选择 运算 。 流 水 线 方法 则 无 需 使 用 临时 关系 ， 而 是 在 第 一 
个 选择 运算 生成 中 间 结 果 的 每 一 个 元 组 时 ， 直 接 对 该 元 组 执行 第 二 个 选择 运算 ， 最 后 才 将 满 
足 第 二 个 选择 条 件 的 元 组 存 到 结果 关系 中 。 

通常 ， 在 DBMS 内 部 流水 线 是 被 作为 一 个 独立 的 过 程 或 者 线程 实现 的 。 每 一 条 流水 线 
都 是 在 输入 端 接 收 一 个 元 组 流 ， 然 后 再 生成 一 个 元 组 流 作 为 流水 线 的 输出 。 每 一 对 相 邻 的 运 
算 之 间 都 有 一 个 缓冲 区 ， 用 来 暂 存 从 一 个 运算 输送 到 另 一 个 运算 的 元 组 。 流 水 线 的 一 个 缺陷 
就 是 运算 的 所 有 输入 不 一 定 在 处 理 开始 时 就 全 部 可 用 ， 这 就 限制 了 算法 的 选择 。 例 如 ， 如 果 
有 一 个 连接 运算 ， 流 水 线 化 的 输入 元 组 并 没有 在 连接 属性 上 排序 ， 那 么 我 们 就 不 能 使 用 标准 
的 分 类 归并 连接 算法 。 然 而 ， 在 执行 策略 中 仍然 有 许多 机 会 可 用 到 流水 线 。 


23.5.2 ”线性 树 


在 本 草 前 面 的 章节 中 创建 的 所 有 关系 代数 树 都 具有 如 图 23-13a 所 示 的 形式 。 这 种 类 型 
的 关系 代数 树 被 称 为 左 深 (连接 ) 树 (left-deep(join) tree)。 这 个 术语 和 执行 查询 时 运算 的 结 
合 方式 有 关 ， 也 就 是 说 只 人 允许 连接 的 左 侧 为 前 一 个 连接 运算 的 计算 结果 ， 因 此 被 称 为 左 深 
树 (left-deep tree)。 对 于 连接 算法 而 言 ， 左 子 节点 是 外 关系 ， 右 子 节点 是 内 关系 。 其 他 类 型 
的 关系 代数 树 还 包括 右 深 树 ( right-deep tree)， 如 图 23-13b 所 示 ， 以 及 丛生 树 (bushy tree), 
如 图 23-13d 所 示 。 从 生 树 也 称 为 非 线 性 树 ， 左 深 树 和 右 深 树 则 被 称 为 线性 树 。 图 23-13c 给 
出 了 另外 一 种 线性 树 的 示例 ， 它 既 不 是 左 深 树 ， 又 不 是 右 深 树 。 

对 于 线性 树 ， 在 运算 符 某 一 侧 的 关系 都 是 基础 关系 。 但 是 对 于 外 关系 的 每 一 个 元 组 ， 我 
们 都 要 对 整个 内 关系 进行 测试 ， 所 以 内 关系 必须 是 物化 的 。 这 使 得 左 深 树 更 具有 吸引 力 ， 因 
为 其 内 关系 总 是 基础 关系 (因此 总 是 物化 的 )。 

左 深 树 的 优点 在 于 能 够 缩小 最 优 策略 的 搜索 空间 ， 并 且 正 如 我 们 稍 后 将 讨论 的 那样 ， 查 
询 优 化 器 还 能 基于 动态 的 处 理 技 术 。 其 主要 缺点 在 于 ， 在 缩小 搜索 空间 的 过 程 中 ， 放 弃 了 许 
多 可 选 的 执行 策略 ， 它 们 当中 也 许 存 在 着 某 些 策略 ， 其 开销 比 线性 树 的 开销 更 低 。 左 深 树 支 
持 完全 流水 线 化 的 策略 ， 即 在 此 策略 中 ， 全 部 采用 流水 线 来 执行 连接 运算 。 
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23.5.3 物理 算 子 和 执行 策略 


术语 物理 算 子 ( physical operator) 有 时 用 以 表示 实现 某 个 数据 库 逻 辑 运算 (比如 选择 或 
者 连接 ) 的 一 个 特定 算法 。 例 如 ， 我 们 可 以 使 用 物理 算 子 “分 类 归并 连接 ”实现 关系 代数 的 
连接 运算 。 用 物理 算 子 替换 关系 代数 树 中 的 逻辑 运算 ， 就 为 该 查询 生成 了 一 个 执行 策略 〈 也 
称 为 查询 执行 计划 或 者 访问 计划 )。 图 23-14 给 出 了 一 个 关系 代数 树 和 一 个 相应 的 执行 策略 。 


Ps staffNo=p.staffNo HY 列 连接 Ds staffNo=p.staffNo i 
带 流水 的 索引 peti NK atmo te 
Ps. branchNo=b,branchNo PropertyForRent 嵌 套 循环 连接 bdspranchNo=b.branchNo PropertyForRent 
Os. position="Manager’ Ob. city="London’ BL FA position E Os position='Manager’ Op, city="London' 现 用 city 上 的 
的 散 列 索引 | | 散 列 索引 
Staff Branch Staff Branch 
a) 关系 代数 树 示例 b) 对 应 的 一 个 执行 策略 
图 23-14 


虽然 各 个 DBMS 一 般 拥 有 各 上 自 的 内 部 实现 ， 但 仍 可 认为 下 列 抽 象 算 子 实现 关系 代数 树 
叶 节 点 上 的 功能 : 
(1) TableScan(R): 以 任意 顺序 读 取 R 的 所 有 块 。 
(2) SortScan(R, L): 顺序 读 取 R 的 元 组 ， 元 组 已 根据 列表 L 中 的 属性 (E) 排 好 序 。 
(3) IndexScan(R, P): P 为 形 如 Abc 的 谓词 ， 其 中 ，A 为 R 的 一 个 属性 ，9 为 一 个 常用 
的 比较 运算 符 ，e 为 常量 。 对 R 的 元 组 的 读 取 是 通过 属性 A 上 的 索引 实现 的 。 
(4) IndexScan(R,A) : A 为 R 的 一 个 属性 ， 利 用 属性 A 上 的 索引 对 R 进行 全 关系 检索 。 
尽管 与 TableScan 相似 ,但 是 在 某 些 情况 下 (比如 ，R 是 非 聚 集 存储 的 )， 效 率 可 能 
更 高 。 
另外 ，DBMS 通常 支持 统一 的 和 迭代 器 (iterators) 接口 ， 该 接口 将 每 一 个 算 子 的 内 部 实 
现 细节 隐藏 了 起 来 。 迭 代 旨 接 口 是 由 以 下 三 种 滑 数 构成 的 : 
(1) Open: 该 函数 在 检索 第 一 个 元 组 之 前 初始 化 迭代 器 的 状态 ， 并 为 输入 和 输出 分 配 好 
缓冲 区 。 它 的 参数 定义 了 选择 的 条 件 ， 而 选择 的 条 件 决定 操作 的 行为 。 
(2) GetNext: 该 函数 返回 结果 中 的 下 一 个 元 组 ， 并 将 其 置 于 输出 缓冲 区 内 。GetNext 又 
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调用 每 一 个 输入 节点 上 的 GetNext 函数 ， 然 后 对 输入 执行 算 子 特定 的 代码 ， 产 生 输 
出 结果 。 最 后 更 新 迭代 颖 的 状态 以 反映 输入 元 组 的 处 理 进度 。 
(3) Close: 当 全 部 的 输出 元 组 都 已 生成 (通过 反复 调用 GetNext) a, PAR Close 将 终 
止 操作 并 整理 ， 根 据 要 求 释放 缓冲 区 。 
在 使 用 迭代 器 时 ， 许 多 运算 可 能 立即 被 激活 。 元 组 根据 要 求 在 操作 之 间 传 递 ， 自 然 地 支 
持 了 流水 技术 。 然 而 ， 究 竞 是 选择 流水 线 技术 还 是 物化 技术 ， 要 根据 人 处理 输入 元 组 的 算 子 特 
定 的 代码 而 定 。 如 果 代 码 允 许 输 入 元 组 一 旦 被 接收 就 进行 处 理 ， 那 么 就 选择 流水 线 技术 ; 如 
果 代 码 需 要 对 相同 的 输入 元 组 进行 多 次 处 理 的 话 ， 则 应 选用 物化 技术 。 


23.54 ”缩小 搜索 空间 


正如 本 节 开 篇 所 讲 ， 复 杂 查 询 的 搜索 空间 可 能 非常 大 。 为 了 缩小 搜索 策略 不 得 不 探究 的 
搜索 空间 ， 查 询 优化 融 一 般 用 几 种 不 同 的 方法 对 搜索 空间 进行 限制 。 最 篆 用 于 一 元 选择 和 投 
影 运算 的 限制 规则 为 : 

限制 规则 1 : 一 元 运算 采用 即时 处 理 策略 ， 即 关系 在 第 一 次 被 访问 时 就 执行 选择 运算 ; 

当 其 他 运算 的 结果 元 组 产生 时 即时 执行 投影 运算 。 

这 就 意味 着 所 有 的 运算 都 被 作为 连接 运算 的 一 部 分 来 处 理 。 现 在 我 们 考虑 将 例 23.3 简 

化 之 后 的 这 个 查询 : 


SELECT p.propertyNo, p.street 
FROM Client c, Viewing v, PropertyForRent p 
WHERE c.clientNo = v.clientNo AND v.propertyNo = p.propertyNo; 


从 本 节 一 开始 的 讨论 来 看 ， 该 查询 有 12 种 可 能 的 连接 次 序 。 可 是 ， 要 注意 其 中 一 些 连 
接 次 序 导 臻 最 后 执行 的 是 笛 卡 儿 乘积 而 不 是 连接 运算 。 例 如 : 


Viewing >< (Client >< PropertyForRent) 


上 述 连 接 次 序 导 致 在 Client 和 PropertyForRent 之 间 实 际 执行 的 是 笛 卡 儿 乘 积 。 下 面 的 
限制 规则 去 除了 包含 了 笛 卡 儿 乘 积 的 非 最 优化 的 连接 树 。 

限制 规则 2: 除非 查询 本 身 指定 ， 和 否则 无 论 如 何不 应 形成 笛 卡 儿 乘 积 。 

最 后 考虑 连接 树 的 形状 。 正 如 23.5.2 节 讨 论 的 那样 ,最 典型 的 处 理 方法 就 是 利用 左 深 树 
的 内 操作 数 均 为 基础 关系 ， 从 而 已 经 物化 这 一 事实 : 

限制 规则 3: 每 个 连接 运算 的 内 操作 数 都 须 是 基础 关系 ， 不 能 为 中 间 结 果 关 系 。 

第 三 个 限制 规则 比 前 两 个 规则 更 具有 启发 性 ， 并 且 排 除了 许多 的 备 选 策 略 ， 其 中 有 一 些 
策略 的 代价 其 实 比 采 用 左 深 树 策略 的 代价 更 低 。 然 而 ， 经 验 告诉 我 们 ， 在 大 多 数 情况 下 ， 最 
优 左 深 树 策略 的 代价 不 会 比 全 局 最 优 树 的 代价 高 多 少 。 并 且 ， 第 三 种 限制 规则 极 大 地 减少 了 
备 选 连接 策略 的 个 数 。 当 查询 涉及 nn 个 关系 时 ， 这 些 备 选 连接 策略 的 数量 级 达 0(2”)， 对 应 
的 时 间 复 杂 度 达 0(3”)。 利 用 这 种 方法 ， 查 询 优化 融 能 够 有 效 地 处 理 涉 及 十 个 关系 的 查询 ， 
这 足以 满足 传统 商业 应 用 中 绝 大 多 数 的 查询 。 


23.5.5 MBAR 


| 采用 动态 规划 技术 的 左 深 树 算法 是 在 设计 System R AY 4A OE Ae aR A Pe HE th OEY 
(Selinger et al.，1979 )。 从 那 时 起 ， 许 多 商用 系统 都 采用 了 这 种 基本 策略 。 本 节 ， 我 们 对 该 
算法 进行 概述 ， 左 深 树 算法 本 质 上 是 一 个 动态 前 枝 、 穷 举 搜索 的 算法 。 
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动态 规划 算法 是 基于 这 样 一 个 假设 : 代价 模型 满足 优化 原则 。 因 此 ， 为 了 得 到 包含 了 
n 个 连接 的 查询 的 最 优 策略 ， 我 们 只 需要 考虑 包含 了 (n-1) 个 连接 的 子 表 达 式 的 最 优 策 略 ， 
然后 再 对 这 些 策略 进行 扩展 ， 即 再 添加 一 个 连接 。 而 其 余 非 最 优 的 策略 就 可 以 不 必 再 考虑 。 
然而 ， 用 这 种 简单 的 形式 ,一 些 有 用 的 策略 可 能 会 被 丢失 。 考 虑 下 面 的 查询 : 

SELECT p.propertyNo, p.street 

FROM Client c, Viewing v, PropertyForRent p 


WHERE c.maxRent < 500 AND c.clientNo = v.clientNo AND 
v.propertyNo = p.propertyNo; 


假设 在 关系 Client 的 属性 clientNo 和 属性 maxRent EA gE B 树 索 引 ， 优 化 器 同 
时 支持 分 类 归并 连接 和 块 藤 套 循环 连接 。 在 考虑 访问 关系 Client 的 所 有 可 能 方式 时 ， 我 们 
会 估算 对 Client 进行 线性 搜索 和 利用 两 个 B 树 搜索 的 代价 。 如 果 最 优 策略 是 利用 maxRent 
上 的 B’' 树 索引 进行 搜索 的 话 ， 我 们 将 会 放弃 男 外 两 种 方式 。 可 是 ， 如 果 利 用 clientNo 上 
H B 树 索 引 则 会 使 得 关系 Client 在 连接 属性 clientNo 上 有 序 ， 这样 的 话 ， 系 统 就 会 以 更 小 
的 代价 实现 Client 和 Viewing (作为 已 排序 关系 ) 的 分 类 归并 连接 。 为 了 保证 这 种 可 能 性 不 
会 被 丢弃 ， 算 法 引入 了 一 个 新 的 概念 : 感 兴趣 序 (interesting orders)， 即 若 某 一 中 间 结 果 或 
在 ORDER BY 的 属性 、 或 在 GROUP BY 的 属性 或 者 其 后 任 一 参与 连接 操作 的 属性 上 有 序 ， 
则 称 该 中 间 结 果 含有 一 个 感 兴趣 序 。 前 例 中 ， 属 性 c.clientNo v.clientNo, v.propertyNo 和 
p.propertyNo 都 是 感 兴趣 的 〈interesting)。 在 优化 的 过 程 中 ， 如 果 任 何 一 个 中 间 结 果 在 任意 
一 个 这 样 的 属性 上 有 序 ， 则 对 应 的 部 分 策略 必须 被 保留 在 搜索 策略 中 。 

动态 规划 算法 自 下 而 上 地 生成 所 有 能 够 满足 前 一 小 节 和 定义 的 各 条 限制 规则 的 备 选 连接 
树 。 具 体 过 程 如 下 所 述 。 

第 1 遍 : 列 出 对 每 一 个 基础 关系 进行 线性 搜索 以 及 利用 所 有 可 用 的 索引 进行 搜索 的 策 
略 。 根 据 每 一 个 感 兴趣 序 (如 前 所 述 )， 将 这 些 部 分 (单个 关系 上 的 ) 策略 划分 为 等 价 类 ， 然 
后 再 生成 一 个 含 非 感 兴趣 序 的 等 价 类 。 对 每 一 个 等 价 类 ， 保 留 代 价 最 低 的 那个 策略 ， 以 备 下 
一 步 使 用 。 对 于 含 非 感 兴趣 序 的 等 价 类 中 代价 最 低 的 策略 ， 知 其 代价 不 低 于 所 有 其 他 的 策 
略 ， 则 不 予 保留 。 对 于 给 定 的 关系 R， 任何 仅 涉 及 R 的 属性 的 选择 运算 都 被 即时 处 理 。 同 
样 ， 任 何不 在 SELECT 子 句 中 出 现 的 并 且 对 后 面 的 连接 运算 也 毫 无 贡献 的 R 的 属性 ， 则 在 
此 阶段 通过 投影 被 去 除 (根据 限制 规则 1 )。 

第 2 遍 : 将 第 1 遍 保留 下 来 的 所 有 单个 关系 的 策略 作为 外 关系 ， 并 且 去 除 所 有 的 笛 卡 儿 
乘积 (根据 限制 规则 2 )， 就 能 够 产生 包含 了 两 个 关系 的 全 部 策略 。 同 样 ， 所 有 随即 处 理 都 被 
执行 掉 ， 并 且 每 一 个 等 价 类 中 只 有 代价 最 低 的 策略 被 保留 下 来 ， 以 备 后 用 。 

P kin: 将 第 (Kk-1) 遍 保 留 的 策略 作为 外 关系 ， 去 除 所 有 的 笛 卡 儿 乘 积 ， 并 且 对 选择 
和 投影 执行 即时 处 理 ， 就 可 以 产生 包含 了 大 个 关系 的 全 部 策略 。 同 样 ， 每 一 个 等 价 类 中 最 低 
代价 的 策略 被 保留 ， 以 备 后 用 。 

hon iid: 将 第 (n-1) RARER TE APRA, FFA RRA ARIA, AT 
以 生成 包含 了 个 关系 的 全 部 策略 。 经 过 前 校 ， 我 们 就 得 到 了 该 查询 的 代价 最 低 的 全 局 
策略 。 

尽管 这 个 算法 仍然 是 指数 级 的 ， 但 是 有 一 些 查 询 形 式 的 策略 个 数 只 有 O(n’), Ale 
n 二 10， 则 其 量 级 为 1000， 这 与 本 节 开 始 得 出 的 1760 亿 个 不 同 的 连接 次 序 相 比 有 了 显著 的 
提高 。 
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23.5.6 ”语义 查询 优化 


查询 优化 时 男 一 种 缩小 搜索 空间 的 方法 是 基于 定义 在 数据 库 模式 上 的 约束 。 这 种 方法 被 
称 为 语义 查询 优化 ， 可 以 综合 前 面 讨论 的 技术 一 起 使 用 。 例 如 ， 在 7.2.5 节 ， 我 们 定义 了 一 
个 一 般 性 约束 ， 该 约束 用 下 述 断 言 限制 了 一 个 员工 不 能 同时 管理 超过 100 处 的 房产 : 
CREATE ASSERTION StaffNotHandlingTooMuch 
CHECK (NOT EXISTS (SELECT staff No 
FROM PropertyForRent 
GROUP BY staffNo 
HAVING COUNT(*) > 100)) 
现在 考虑 查询 : 
SELECT s.staffNo, COUNT(*) 
FROM Staff s, PropertyForRent p 
WHERE s.staffNo = p.staffNo 
GROUP BY s:staffNo 
HAVING COUNT(*) > 100; 
如 果 优 化 硕 知 道 该 约束 的 存在 ， 就 无 需 对 该 查询 进行 优化 ， 因 为 没有 哪个 组 能 够 满足 
HAVING 子 句 。 
再 例如 ， 硅 有 加 在 员工 薪水 上 的 约束 : 
CREATE ASSERTION ManagerSalary 
CHECK (salary > 20000 AND position = Manager ) 
考虑 下 面 这 个 查询 : 


SELECT s.staffNo, fName, IName, propertyNo 

FROM Staff s, PropertyForRent p 

WHERE s.staffNo = p.staffNo AND position = ‘Manager’; 
利用 上 面 的 约束 ， 我 们 可 以 重 写 该 查询 为 : 


SELECT s.staffNo, fName, IName, propertyNo 
FROM Staff s, PropertyForRent p 
WHERE s.staffNo = p.staffNo AND salary > 20000 AND position = ‘Manager’; 


如 果 关 系 Staff 只 存在 属性 salary 上 的 B 树 索引 的 话 ， 则 增加 的 这 个 谓词 可 能 会 非常 有 
用 。 反 之 ， 如 采 不 存在 这 样 的 索引 ， 那 么 这 个 新 增 的 谓词 将 会 使 得 该 查询 复杂 化 。 关 于 语 


义 查询 优化 的 更 多 的 信息 ， 感 兴趣 的 读者 请 参见 King ( 1981 )、Malley and Zdonik ( 1986 )、 
Chakravarthy et al. ( 1990 ) 和 Siegel et al. ( 1992 ). 


23.5.7 ”其 他 查询 优化 方法 


查询 优化 是 一 个 适 于 进行 研究 的 领域 ， 人 们 提出 了 许多 代替 System R 的 动态 规划 算法 
WATE. Bila, RWB (simulated annealing) 算法 对 图 进行 搜索 ， 图 的 节点 对 应 全 部 执行 
策略 的 集合 (该 算法 模拟 退火 的 过 程 : 晶体 的 形成 是 先 对 容器 内 的 液体 加 热 ， 然 后 再 让 其 慢 
慢 冷却 )。 每 一 个 节点 都 有 一 个 相应 的 代价 ， 算 法 的 目标 是 找到 那个 具有 全 局 最 小 代价 的 节 
点 。 从 一 个 节点 问 男 一 个 节点 移动 时 ， 如 果 源 节点 的 代价 高 于 ( 低 于 ) 目标 节点 的 代价 ， 则 
被 认为 是 下 山 (上山 )。 铬 从 某 节 点 出 发 的 所 有 路 径 上 ， 任 意 一 个 下 山 的 移动 都 跟 在 至 少 一 
个 上 出 的 移动 之 后 ， 则 称 该 节点 为 局 部 最 小 节点 。 知 某 节 点 为 所 有 节点 中 代价 最 小 者 ， 则 称 
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此 节点 为 全 局 最 小 节点 。 该 算法 持续 不 断 地 进行 随机 移动 ， 总 是 接受 下 山 移动 ， 而 以 某 种 概 
率 接受 上 山 移动 ， 试 图 避免 具有 较 高 代价 的 局 部 最 小 节点 。 这 个 概率 会 随 着 时 间 的 推移 而 不 
断 降低 ， 最 终 变 为 零 。 一 旦 变 为 零 ， 搜 索 终止 ， 将 所 访问 过 的 具有 最 低 代 价 的 节点 返回 ， 作 
为 最 优 执行 策略 。 感 兴趣 的 读者 请 参见 Kirkpatrick et al.( 1983 ) 和 Ioannidis and Wong( 1987 )。 

JER BGE (Iterative Improvement) 算法 则 进行 大 量 的 局 部 优化 ， 每 一 个 局 部 优化 都 是 从 随 
机 选取 的 节点 开始 ， 然 后 反复 执行 随机 的 回 下 移动 直到 到 达 一 个 局 部 最 小 节点 。 感 兴趣 的 读 
者 请 参见 Swami and Gupta (1988 ) 和 Swami ( 1989 ) 。 两 阶段 优化 ( Two-Phase Optimization ) 
算法 是 模拟 退火 与 迭代 改进 的 混合 算法 。 在 第 一 阶段 ， 利 用 迭代 改进 进行 局 部 优化 ， 生 成 局 
部 最 小 节点 。 将 该 局 部 最 小 节点 作为 第 二 阶段 的 输入 ， 第 二 阶段 则 基于 模拟 退火 ， 该 算法 具 
有 一 个 较 低 的 回 上 移动 的 起 始 概 率 。 感 兴趣 的 读者 请 参见 Ioannidis and Kang ( 1990 ) 。 

模拟 生物 现象 的 遗传 (Genetic) 算法 也 已 经 被 用 于 查询 优化 。 该 算法 从 随机 的 一 组 策略 构 
成 的 原始 种 群 开始 ， 其 中 每 个 策略 都 有 自己 的 代价 。 然 后 ， 将 种 群 中 的 每 一 对 策略 进行 匹配 
产生 子 代 ， 尽 管子 代 能 随机 地 发 生 一 些小 的 变化 (变异 ), 但 是 子 代 还 是 继承 了 双亲 策略 的 特 
征 。 在 下 一 代 里 ， 算 法 只 保留 了 那些 具有 最 低 代 价 的 父 或 子 。 当 整个 种 群 都 是 由 同一 个 (最 
优 的 ) 策略 的 不 同 复制 形式 组 成 时 ， 算 法 终止 。 感 兴趣 的 读者 请 参见 Bennett et al. (1991 )。 

A* 启发 式 ( A* heuristic) 算法 已 经 在 人 工 智能 中 得 到 了 应 用 ， 主 要 用 以 解决 复杂 搜索 
问题 ， 并 且 也 已 经 被 用 于 查询 优化 (Yoo and Lafortune，1989 )。 与 前 面 讨 论 的 动态 规划 算 
法 不 同 ，A* 算法 基于 策略 与 最 优 策略 的 邻近 度 ， 每 次 只 对 一 个 执行 策略 进行 扩展 。 已 经 证 
明 ， 与 动态 规划 相 比 ，A* 能 够 更 早 地 生成 一 个 完整 的 策略 ， 并 且 剪 枝 的 力度 更 大 。 


23.5.8 ”分布 式 查询 优化 


在 第 24 章 和 第 25 章 我 们 将 讨论 分 布 式 DBMS ( DDBMS)，DDBMS 由 逻辑 上 相关 、 物 
理 上 却 分 布 于 计算 机 网 络 中 的 多 个 数据 库 构 成 ， 而 每 一 个 数据 库 都 是 在 本 地 DBMS 的 控制 
下 运行 的 。 在 DDBMS 中 ， 一 个 关系 可 能 被 划分 成 了 分 布 在 若干 个 节点 的 多 个 片断 ， 各 片 
断 包含 的 信息 可 以 重复 。 在 25.6 节 ， 我 们 将 考虑 DDBMS 的 查询 优化 。 由 于 数据 分 布 在 网 
络 的 各 个 节点 ， 因 此 分 布 式 查询 优化 变 得 更 加 复杂 。 在 分 布 的 环境 中 对 不 同 的 策略 进行 比较 
时 ， 除 了 要 考虑 本 地 的 处 理 代 价 ( 即 CPU 和 IO 开销 ) 以 外 ， 也 要 考虑 到 底层 网 络 速度 对 
策略 的 影响 。 我 们 将 综合 考虑 上 述 因素 对 以 下 两 个 查询 优化 算法 进行 讨论 : 一 个 算法 是 对 
System R 的 动态 规划 算法 的 扩展 ; 另 一 个 算法 则 来 自 于 另外 一 个 非常 著名 的 DDBMS 的 研 
究 项 目 SDD-1。 


23.6 ”查询 处 理 与 优化 


在 前 面 的 小 节 中 ， 我 们 介绍 了 新 SQL 标准 的 一 些 特征 ， 尽 管 其 中 一 些 特征 (比如 操作 
符 ) 已 经 被 延缓 到 较 晚 一 些 的 版 本 去 了 。 这 些 特征 解决 了 我 们 在 9.2 节 讨 论 的 关系 模型 存在 
的 一 些 问题 。 遗 憾 的 是 ， 在 SQL:2011 标准 中 未 讨论 这 些 扩展 特性 的 某 些 方面 的 问题 ， 因 
此 ， 关 于 它们 的 具体 实现 ， 例 如 如 何 定义 新 的 索引 结构 的 机 制 、 如 何 为 查询 优化 器 提供 用 户 
自 定义 函数 的 代价 信息 等 ， 这 些 问题 将 因 产 品 的 不 同 而 不 同 。 第 三 方 软件 供应 商 缺乏 将 其 软 
件 与 各 种 ORDBMS 集成 的 标准 方法 ， 因 此 ,除了 SQL:2011 已 经 定义 的 内 容 以 外 ， 还 需要 
制定 更 加 完善 的 标准 。 本 节 将 通过 铬 干 说 明 性 的 例子 ， 探 讨 为 何 这 些 机 制 对 于 一 个 真正 的 
ORDBMS 非常 重要 。 
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| 例 23.6 六 再 看 用 户 自 定义 函数 的 用 法 
列 出 分 公司 B003 可 供出 租 的 公寓 。 
实现 该 查询 时 用 到 了 下 面 这 个 函数 : 


CREATE FUNCTION flatTypes() RETURNS SET(PropertyForRent) 
SELECT * FROM PropertyForRent WHERE type = ‘Flat’; 


则 查询 语句 如 下 : 


SELECT propertyNo, street, city, postcode 
FROM TABLE (flatTypes()) 
WHERE branchNo = ‘B003’; 


在 本 例 中 ,我 们 希望 查询 处 理 需 能 够 通过 下 列 步 又 将 查询 平板 化 : 


(1) SELECT propertyNo, street, city, postcode 
FROM TABLE (SELECT * FROM PropertyForRent WHERE type = ‘Flat’) 
WHERE branchNo = ‘B003’; 


(2) SELECT propertyNo, street, city, postcode 
FROM PropertyForRent 
WHERE type = ‘Flat’ AND branchNo = ‘B003’; 


如 果 在 表 PropertyForRent 的 branchNo 列 上 存在 一 个 B 树 案 引 ， 则 查询 处 理 器 应 该 能 够 
利用 带 索 引 的 扫描 ， 就 像 23.4 节 讨 论 的 那样 ， 通 过 扫描 branchNo 列 而 实现 对 满足 查询 需求 
的 行 的 高 效 检索 。 « 


从 本 例 可 以 看 出 ， 任 何 时 候 只 要 有 可 能 ，ORDBMS 查询 处 理 器 都 应 该 具有 将 查询 平板 
化 的 能 力 。 在 本 例 中 这 样 做 是 可 行 的 ， 因 为 用 户 自 定义 的 函数 也 是 用 SQL 实现 的 。 可 是 ， 
如 果 假 设 函 数 为 外 部 函数 ， 则 查询 处 理 器 怎样 才能 知道 应 该 如 何 优化 这 一 查询 呢 ? 答案 就 在 
于 需要 一 种 可 扩展 的 查询 优化 机 制 。 可 能 需要 用 户 在 定义 新 的 ADT 时 提供 一 些 例 程 ， 并 指 
明 查 询 优 化 器 应 如 何 使 用 。 例 如 Illustra ORDBMS (FLW Informix 的 一 部 分 )， 在 定义 (外 部 ) 
用 户 自 定义 函数 时 ， 需 要 提供 下 列 信息 : 


A 函数 每 次 被 调用 时 的 CPU 的 开销 


函数 所 读 实 参 字 节 数 的 期 望 百 分 比 。 这 是 针对 函数 的 某 个 参数 为 大 对 象 类 型 的 情况 ， 而 在 处 理 过 程 
中 可 能 没 必 要 用 到 整个 对 象 的 信息 


C 读 取 每 个 字 节 的 CPU 开销 


则 函数 调用 的 CPU 开销 根据 公式 A 十 C* ( B* 参数 大 小 的 期 望 值 ) 计算 ，LO 开销 是 B* 
参数 大 小 的 期 望 值 。 

因此 , 在 ORDBMS 中 ， 我 们 还 是 可 以 期 望 能 为 执行 查询 优化 提供 所 需 信 息 。 这 样 做 的 
问题 是 ， 对 用 户 来 说 提供 这 些 数 据 可 能 很 困难 。 或 许 一 个 更 具 吸 引力 的 方法 是 ，ORDBMS 
可 以 基于 实验 获得 这 些 数 据 ， 即 函数 在 对 具有 不 同 大 小 和 不 同 复杂 性 的 对 象 进 行 处 理 时 获得 
实验 数据 。 


| 例 23.7 D) 不 同 的 查询 处 理 启 发 式 
找 出 格拉 斯 哥 市 所 有 两 英里 以 内 有 小 学 校 且 由 Ann Beech 管理 的 独 体 别墅 类 房产 。 


SELECT * 
FROM PropertyForRent p, Staff s 
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WHERE p.staffNo = s.staffNo AND 
p.nearPrimarySchool(p.postcode) < 2.0 AND p.city = ‘Glasgow’ AND 
s.fName = ‘Ann’ AND s.IName = ‘Beech’; 
WF baw, RMB A Be TOBA AP A E X eK nearPrimarySchool, Arh 
数 根据 邮政 编码 和 已 知 建筑 (例如 住宅 区 、 商 厦 、 工 业 区 ) 的 内 部 数据 库 信息 来 判断 与 最 近 
的 小 学 的 距离 。 我 们 将 查询 转换 为 23.3 节 讨 论 的 关系 代数 树 ， 如 图 23-15a 所 示 。 如 果 使 用 
通常 的 查询 处 理 启发 式 原 则 ， 则 应 该 将 选择 运算 提前 到 笛 卡 儿 乘 积 之 前 执行 ， 然 后 将 笛 卡 儿 
乘积 /选择 运算 转换 为 一 个 连接 运算 ， 如 图 23-15b 所 示 。 在 本 例 中 ,， 这 可 能 不 是 最 佳 的 策 
略 。 如 果 每 次 调用 用 户 自 定义 函数 nearPrimarySchool 时 都 要 进行 大 量 的 处 理工 作 ， 则 下 述 
策略 也 许 更 好 : 首先 在 Staff 表 上 执行 选择 运算 ， 然后 在 staffNo 上 执行 连接 运算 ， 最 后 再 
调用 用 户 自 定义 函数 。 对 于 本 例 ， 我 们 还 可 以 利用 连接 的 可 交换 性 规则 重新 安排 叶 节点 的 位 
置 ， 以 便 让 有 更 多 限制 的 选择 运算 先 被 执行 (作为 左 深 连 接 树 的 外 关系 )， 如 图 23-15c 所 示 。 
此 外 ， 如 果 按 照 既定 的 从 左 到 右 的 执行 顺序 执行 ( nearPrimarySchool( )<2.0 AND city= 
‘Glasgow’) 上 的 选择 运算 的 查询 计划 ， 并 且 既 不 存在 已 定义 的 索引 也 没有 事先 按 某 属性 排 
序 ， 那 么 同样 ， 其 执行 效率 也 没有 下 述 查 询 计 划 高 效 : 首先 执行 (city 王 ‘Glasgow’ ) 上 的 选 
择 运算 ， 然 后 再 执行 (nearPrimarySchool( )<2.0) 上 的 选择 运算 ， 如 图 23-15d 所 示 。 


Op.nearPrimarySchool(p.postcode)<2.0 
a p.city="Glasgow’ Wp 
Us fName='Ann’ a slIName='Beech' Op nearPrimarySchool(p.postcode}< 2.0 Os fName="Ann’ 
a p.city="Glasgow’ a 8.JName='Beech’ 
Op.staffNo=s.staffNo 
P S 
X 
P S 
a) 规范 的 关系 代数 树 b) 优化 后 的 关系 代数 树 ( 提前 
t 执行 所 有 的 选择 运算 ) 
pnearPrimarySchool(p.postcode)<2.0 
A p.city='Glasgow’ Op.nearPrimarySchool(p.postcode)<2 0 
Os. fName="Ann’ ~ s.IName="Beech’ P Os fName='Ann’ a sJName='Beech' Gp.city='Giasgow' 
S S P 
c) 优化 后 的 关系 代数 树 ( 仅 提 前 d) 优化 后 的 关系 代数 树 ( 将 对 Property- 
执行 对 Staff 的 选择 运算 ) ForRent 的 选择 运算 分 离 出 来 先 执行 ) 


图 23-15 
在 例 23.7 中 ， 用 户 自 定义 函数 nearPrimarySchool 的 结果 是 一 个 浮 点 值 ， 表 示 某 房产 与 
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其 最 近 小 学 之 间 的 距离 。 提 高 查询 性 能 的 一 个 可 用 策略 是 添加 一 个 索引 ， 不 是 为 函数 的 执行 
添加 索引 ， 而 是 为 其 结果 添加 索引 。 例 如 ,在 Tllustra 中 ， 可 以 使 用 下 述 SQL 语句 为 UDF 
(用 户 自 定义 函数 ) 的 结果 创建 一 个 索引 : 

CREATE INDEX nearPrimarySchoolindex 

ON PropertyForRent USING B-tree (nearPrimarySchool(postcode)); 

现在 ， 无 论 何 时 ， 当 一 条 新 记录 被 插入 表 PropertyForRent 中 ,或 者 一 条 已 有 记录 的 
postcode 列 被 更 新 时 ，ORDBMS 都 将 计算 nearPrimarySchool 函数 并 对 结果 进行 索引 。 当 一 
条 PropertyForRent 记录 被 删除 时 ，ORDBMS 将 再 次 计算 该 函数 以 便 删 除 相 应 的 索引 记录 。 
因此 ， 当 查询 中 出 现 UDF 时 ，Illustra 就 能 利用 索引 检索 记录 ， 以 提高 啊 应 速度 。 

另 一 个 可 选 策略 是 允许 在 客户 端 而 不 是 在 服务 硕 端 调用 UDF。 当 UDF 的 处 理 量 很 大 ， 
而 且 客 户 端 具 有 执行 UDF 的 权利 和 能 力 的 时 候 ( 即 客 户 端 是 相当 重要 的 节点 )， 这 也 许 是 一 
个 适当 的 策略 。 这 样 就 减轻 了 服务 需 的 处 理 量 ， 有 助 于 提高 整个 系统 的 性 能 和 吞吐 量 。 

这 还 解决 了 另 一 个 我 们 尚未 讨论 的 与 UDF 相关 的 安全 性 问题 。 当 UDF 导致 运行 时 致命 
错误 发 生 时 ， 如 果 UDF 代码 是 与 ORDBMS 服务 器 链接 的 ， 则 错误 可 能 会 引发 像 服 务 器 裔 
演 这 样 的 严重 后 果 。 显 然 ， ORDBMS 需要 保护 服务 器 以 免 受 到 此 类 错误 的 影响 。 一 种 解决 
方法 是 要 求 所 有 的 UDF 都 用 解释 性 的 语言 (如 SQL 和 Java) 定义 。 不 过 ，SQL:2011 允许 用 
高 级 程序 设计 语言 (如 C 或 C++) 定义 外 部 例 程 ， 并 作为 UDF 被 调用 。 在 这 种 情况 下 ,一 
种 解决 方法 是 在 一 个 与 ORDBMS 服务 融 不 同 的 地 址 空间 运行 UDF， 而 且 在 UDF 和 服务 器 
之 间 使 用 某 种 形式 的 进程 间 通 信 机 制 (PC) 通信 。 在 这 种 情形 下 ， 如 果 UDF 引发 了 一 个 运 
行 时 致命 错误 ， 唯 一 受到 影响 的 进程 就 是 该 UDF 进程 。 


新 的 索引 类 型 


在 例 23.6 中 可 以 看 到 ,在 ORDBMS 中 ， 对 于 返回 标量 数据 (具有 数值 或 字符 数据 类 
型 ) 的 用 户 自 定义 函数 ， 计 算 结 果 并 对 其 建立 索引 是 可 行 的 。 传 统 的 RDBMS 利用 B 树 索 引 
加 快 对 标量 数据 的 访问 ( 见 附录 下 )。 然 而 ，B 树 是 一 种 一 维 的 访问 方法 ， 对 于 多 维 的 访问 需 
求 〈 比 如 地 理 信 息 系统 、 遥 感 勘测 和 图 像 处理 系 统 中 的 访问 需求 ) 并 不 适合 。 由 于 ORDBMS 
具备 定义 复杂 数据 类 型 的 能 力 ， 因 此 需要 专门 的 索引 结构 以 实现 这 类 数据 的 高 效 访问 。 一 些 
ORDBMS 已 经 开始 支持 其 他 的 索引 类 型 ， 例 如 

e HHBH: 允许 在 任何 数据 类 型 (不 仅仅 是 字母 与 数字 类 型 ) 上 建立 B 树 。 

e 四 又 树 (Finkel and Bentley, 1974). 

è K-D-B 树 (Robinson, 1981). 

e RM (Ki): 为 了 快速 访问 二 维 或 三 维 数据 (Gutman，1984 ) 。 

o 栅 格 文件 (Nievergelt et al., 1984). 

e DH: 为 了 文 持 文本 类 型 。 

最 灵活 的 方式 是 允许 植 人 用 户 自 定义 的 任意 索引 结构 。 这 需要 ORDBMS 公开 访问 方法 
接口 ， 该 接口 允许 用 户 提供 满足 自己 特殊 需求 的 自 定 义 访 问 方法 。 这 个 听 起 来 相对 简单 ， 但 
实际 上 编写 访问 方法 的 人 必须 要 考虑 到 诸如 加 锁 、 恢 复 、 页 管理 等 诸多 DBMS 机 制 。 

ORDBMS 能 够 提供 一 个 通用 的 索引 模板 结构 ， 通 常 足以 包括 用 户 可 能 会 设计 的 大 多 
数 的 索引 结构 以 及 一 些 标准 的 DBMS 机 制 的 接口 。 例 如 ， 通 用 搜索 树 ( Generalized Search 
Tree, GiST) 就 是 一 个 基于 B 树 的 索引 模板 结构 ， 它 只 需 少量 编程 ， 适 于 多 种 树 状 索引 结构 


558 BARD TAEKE A 


(Hellerstein et al., 1995). 


23.7 Oracle 的 查询 优化 


在 本 章 的 最 后 ， 讨 论 一 下 Oraclellg 的 查询 优化 机 制 (Oracle Corporation，2011b)。 本 
节 讨 论 仅 限于 基于 基本 数据 类 型 的 优化 。 本 节 采 用 DBMS Oracle 的 术语 ， 即 将 关系 看 成 是 
具有 行 和 列 的 表 。 我 们 已 经 在 H.2 节 对 Oracle 做 了 简介 。 


23.7.1 基于 规则 和 基于 代价 的 优化 


Oracle 支持 两 种 本 章 已 讨论 过 的 查询 优化 方法 : 基于 规则 的 优化 和 基于 代价 的 优化 。 
基于 规则 的 优化 红 

Oracle 基于 规则 的 优化 器 共有 15 条 规则 ， 按 照 效 率 分 为 若干 等 级 ， 如 表 23-4 ra. R 
有 当 查 询 语句 包含 了 使 某 个 访问 路 径 可 用 的 谓词 或 者 其 他 结构 时 ， 优 化 器 才 会 为 表 选 择 该 访 
问 路 径 。 根 据 这 些 等 级 ， 基 于 规则 的 优化 器 为 每 一 种 执行 策略 指定 了 一 个 分 值 ， 并 且 总 是 选 
择 具 有 最 好 (最 低 ) 分 值 的 执行 策略 。 当 两 个 策略 分 值 相 同时 ，Oracle 则 根据 表 在 SQL 语句 
中 出 现 的 顺序 做 出 决策 ， 而 不 再 进行 “ 抢 七 ”(tie-break)。 但 是 ， 一 般 认 为 ， 这 并 不 是 一 种 
特别 好 的 做 出 最 后 抉择 的 办 法 。 


表 23-4 基于 规则 的 优化 等 级 


= wane 

2 | 利用 聚集 连接 确定 单行 。 ”| 10 | 对 被 索引 列 的 限定 范围 的 搜索 
3 | 根据 唯一 列 或 主 关键 字 的 散 列 聚 集 确定 单行 | ”11 。 | 。 对 被 索引 列 的 非 限定 范围 搜索 
5 被 索引 列 的 MAX 值 或 者 MIN 值 
Bit. a ABA 


例如 ， 考 虑 下 列 在 表 PropertyForRent 上 的 查询 ， 假 设 我 们 已 经 分 别 在 主 关键 字 propertyNo、 
列 rooms 和 列 city 上 建立 了 索引 : 

SELECT propertyNo 

FROM PropertyForRent 

WHERE rooms > 7 AND city = ‘London’; 

对 于 该 查询 ， 基 于 规则 的 优化 器 将 考虑 下 列 访问 路 径 

e 单列 访问 路 径 : 根据 WHERE 条 件 (city= “London’” )， 利 用 列 city 上 的 索引 。 该 访 
问 路 径 的 等 级 为 9。 

e 非 限定 的 范围 扫描 : 根据 WHERE 条 件 (rooms>7 )， 利 用 列 rooms 上 的 索引 。 该 访 
问 路 径 的 等 级 为 11。 

e 全 表 扫 描 : 适用 于 所 有 SQL 语句 。 该 访问 路 径 的 等 级 为 15。 

虽然 在 列 propertyNo 上 也 建 有 索引 ， 但 是 由 于 propertyNo 并 未 出 现在 WHERE 子 句 中 ， 
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所 以 基于 规则 的 优化 器 不 会 考虑 该 索引 。 根 据 这 些 路 径 ， 基 于 规则 的 优化 器 将 选择 使 用 列 city 
上 的 索引 。 目 前 可 以 采用 基于 代价 的 优化 ， 这 使 得 基于 规则 的 优化 变 成 受到 择 击 的 特性 。 
基于 代价 的 优化 器 

为 了 改进 查询 优化 ，Oracle Æ Oracle 7 中 引入 了 基于 代价 的 优化 器 。 基 于 代价 的 优化 器 
将 选择 资源 需求 最 小 的 执行 策略 (避免 前 述 的 “ 抢 七 ”异常 )， 这 里 的 资源 是 指 在 对 查询 要 
访问 的 全 部 行进 行 处 理 时 所 必需 的 资源 。 通 过 设置 初始 化 参数 OPTIMIZER_MODE， 用 户 
可 以 选择 最 小 资源 需求 是 基于 吞吐 量 (最 小 化 处 理 查询 所 涉及 的 全 部 行 所 需 的 资源 量 )， 还 
是 基于 响应 时 间 〈 最 小 化 处 理 查询 访问 的 第 一 行 所 需 的 资源 量 )。 基 于 代价 的 优化 器 还 会 考 
虑 用 户 给 出 的 提示 ， 我 们 稍 后 讨论 。 
统计 数据 

基于 代价 的 优化 器 依赖 于 所 有 与 查询 相关 的 表 、 聚 集 和 索引 的 统计 信息 。 然 而 ，Oracle 
并 不 会 自动 地 收集 统计 数据 ， 生 成 统计 数据 并 保持 其 即时 性 是 用 户 的 职责 。PL/SQL 的 
DBMS_STATS 包 可 用 于 产生 和 管理 与 表 、 列 、 索 引 、 划 分 以 及 所 有 存储 在 模式 或 者 数据 库 
中 的 模式 对 象 相 关 的 统计 数据 。 在 任何 可 能 的 时 候 ，Oracle 都 会 采用 并 行 的 方法 收集 统计 数 
据 ， 尽 管 索引 统计 数据 是 串 行 收集 的 。 例 如 ， 可 用 下 列 SQL 语句 收集 模式 “Manager” 的 
模式 统计 数据 : 

EXECUTE DBMS STATS.GATHER SCHEMA STATS(‘Manager’, 

DBMS STATS. AUTO SAMPLE SIZE); 

最 后 一 个 参数 表示 为 了 产生 良好 的 统计 数据 ， 人 允许 Oracle 自动 选择 最 佳 采 样 空 间 的 大 小 。 

在 收集 统计 数据 时 可 以 指定 多 种 选择 。 例 如 ， 可 以 指定 是 计算 整个 数据 结构 的 统计 信息 ， 
还 是 只 计算 数据 的 采样 信息 。 在 后 一 种 情况 下 ， 我 们 还 可 以 指定 是 基于 行 还 是 基于 块 采 样 : 

e 行 采 样 (row sampling) 在 读 取 行 信息 时 不 考虑 其 在 磁盘 上 的 物理 位 置 。 最 坏 的 情况 

是 ， 行 采样 在 每 一 块 都 选取 一 行 ， 这 样 就 需要 对 表 或 者 索引 进行 全 扫描 。 

e k AF (block sampling) 读 取 随机 选取 的 样本 块 信息 ， 利 用 这 些 块 的 所 有 的 行 获取 

统计 数据 。 

与 计算 整个 结构 的 精确 值 相 比 ， 采 样 通常 占用 更 少 的 资源 。 例 如 ， 分 析 一 个 大 型 表 的 
10% 或 者 更 少 的 数据 可 以 得 到 同样 大 小 的 空闲 空间 比 。 

在 创建 或 重 构 索 引 的 时 候 ， 也 可 以 通过 在 CREATE INDEX 或 者 ALTER INDEX 命令 中 
加 入 COMPUTE STATISTICS 选项 而 让 Oracle 收集 统计 数据 。 统 计数 据 保 存在 Oracle 的 数 
据 字 典 里 ， 可 以 通过 表 23-5 所 示 的 视图 进行 查阅 。 每 一 个 视图 可 以 有 三 种 前 级: 

e ALL_ 包 括 了 本 用 户 具有 访问 权限 的 所 有 数据 库 对 象 ， 其 中 含 授予 本 用 户 访问 权限 的 

其 他 模式 对 象 。 
e DBA_ 包括 数 据 库 中 的 所 有 对 象 。 
e USER_ 仅 包括 本 用 户 模 式 下 的 对 象 。 


表 23-5 Oracle 的 数据 字典 视图 


视 描 jÈ 
ALL TABLES 用 户 具 有 访问 权限 的 对 象 和 关系 表 的 信息 
TAB HISTOGRAMS 柱状 图 使 用 的 统计 数据 


TAB COLUMNS 表 / 视图 中 列 的 信息 
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( 续 ) 
视 描 È 
TAB COL STATISTICS 基于 代价 的 优化 器 使 用 的 统计 数据 
TAB_PARTITIONS 被 划分 表 中 各 划分 的 信息 
INDEXES 索引 的 信息 
IND_COLUMNS 每 一 个 索引 中 的 列 信息 
CONS COLUMNS 每 一 个 约束 中 的 列 信 息 
CONSTRAINTS 表 的 约束 信息 
LOBS 数据 类 型 为 大 对 象 (LOB) 的 列 的 信息 
SEQUENCES 顺序 对 象 的 信息 
SYNONYMS 同义词 的 信息 
TRIGGERS 表 触 发 需 的 信息 
VIEWS 视图 的 信息 


提示 


如 前 所 述 ， 基 于 代价 的 优化 器 也 考虑 了 用 户 给 出 的 提示 信息 。 提 示 是 由 SQL 语句 中 特殊 
格式 的 注解 定义 的 。 不 同 的 提示 信息 能 够 强制 优化 器 做 出 各 种 不 同 的 决策 ， 例 如 强制 使 用 : 


o 特定 的 访问 路 径 。 
e 特定 的 连接 次 序 。 


。 特定 的 连接 算 子 ， 例 如 分 类 归并 连接 。 


o 并 行 执行 。 


例如 ， 可 以 利用 下 列 提示 强制 优化 器 使 用 特定 的 索引 : 


SELECT /*+ INDEX(sexindex) */fName, IName, position 


FROM Staff 
WHERE sex = ‘M’; 


如 有 果 男 、 女 员工 的 人 数 差 不 多 ， 则 查询 将 返回 Staff 表 中 几乎 一 半 的 行 ， 这 时 全 表 扫 描 
要 比索 引 扫 描 的 效率 更 高 。 但 是 ， 如 果 我 们 知道 女 员 工 比 男 员 工 的 人 数 多 得 多 ， 则 查询 将 返 
回 Sta 任 表 中 很 少 的 行 ， 这 时 索引 扫描 的 效率 更 高 。 如 果 基 于 代价 的 优化 器 假定 sex 列 上 的 
值 分 布 均匀 ， 则 它 很 有 可 能 选择 全 表 扫 描 。 在 这 种 情况 下 ， 该 提示 会 告诉 优化 器 使 用 sex 列 
上 的 索引 。 
存储 执行 计划 

有 了 时候， 一旦 找到 一 个 最 优 计划 ， 当 该 SQL 语句 被 再 次 提交 的 时 候 ， 优 化 器 就 没有 必 
要 再 次 生成 一 个 新 的 执行 计划 。 因 此 优化 器 可 以 利用 CREATE OUTLINE 语句 创建 一 个 存储 
纲要 (stored outline)， 存 储 纲 要 中 存放 着 优化 器 创建 执行 计划 时 要 用 到 的 属性 。 此 后 ， 优 化 
天 就 可 以 利用 这 些 存 储 属性 创建 执行 计划 ， 而 不 必 产 生 一 个 新 的 计划 。 


23.7.2 柱状 图 


在 前 面 的 小 节 中 ， 我 们 一 直 假 设 表 中 各 列 的 数据 值 是 均匀 分 布 的 。 当 数 据 值 分 布 不 均匀 
时 ， 给 出 描述 数据 值 及 其 相对 频 度 的 柱状 图 ， 有 助 于 提高 优化 器 的 选择 性 估算 的 准确 度 。 例 
如 ， 图 23-16a 为 估计 的 表 PropertyForRent 的 rooms 列 的 均匀 分 布 情 况 ， 图 23-16b 则 刻画 
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的 是 实际 的 非 均 匀 分 布 情 况 。 第 一 种 分 布 可 以 压缩 存储 ， 即 只 需 存储 一 个 最 小 值 (1 ) 和 一 
个 最 大 值 ( 10 )， 以 及 所 有 数据 值 出 现 次 数 的 总 和 《本 例 为 100 )。 


人 02 


10 10 10 10 10 10 10 10 10 10 


2584 8) 67 here 46 12 3°46 Te +Foelree a6 
a) 均匀 分 布 b) 非 均 匀 分 布 


图 23-16 Æ PropertyForRent 的 rooms 列 的 柱状 图 


对 于 像 rooms>9 这 样 的 简单 谓词 而 言 ， 奋 均匀 分 布 ， 则 很 容易 就 可 以 估算 出 结果 关系 
的 元 组 个 数 为 ( 1/110 ) X 100 王 10。 但 是 ,这 样 的 估算 并 不 十 分 准确 (从 图 23-16b 可 以 看 到 ， 
实际 上 只 有 一 个 元 组 ) 。 
柱状 图 就 是 一 种 可 以 用 来 提高 估算 准确 度 的 数据 结构 。 图 23-17 显示 了 两 种 柱状 图 : 
e 等 宽 柱 状 图 : 将 数据 划分 成 固定 个 数 的 等 宽 范 围 ( 称 为 桶 )， 每 个 范围 都 包含 了 落 入 
该 桶 的 一 定数 量 的 值 。 
e 等 高 柱状 图 : 每 一 个 桶 中 放 入 大 臻 相同 个 数 的 值 ， 每 一 个 桶 的 终点 是 由 桶 中 值 的 数 


量 决 定 的 。 
20 20 20 20 20 20 
14 
10 
4 
2 
Vn Ti. S. 9 36 1 2 & 4.25. 36 etre 9: 10 
Count 20 40 28 8 4 
a) 等 宽 b) 等 高 


图 23-17 Æ PropertyForRent 的 rooms 列 的 柱状 图 


例如 ， 假 设 有 5 个 桶 。 列 rooms 的 等 宽 柱 状 图 如 图 23-17a 所 示 。 每 一 个 桶 都 是 等 宽 
的 一 一 两 个 值 之 间 的 宽度 相等 ( 1 一 2，3 一 4 等 )， 并 且 假 设 每 一 个 桶 的 内 部 都 是 均匀 分 布 的 。 
可 以 压缩 存储 等 宽 柱 状 图 信息 ， 只 需 记 录 每 一 个 桶 的 最 大 值 和 最 小 值 ， 以 及 落 和 该 桶 的 值 的 
数量 。 同 样 ， 我 们 仍 以 谓词 rooms>9 为 例 ， 根 据 该 等 宽 柱 状 图 ， 我 们 就 可 以 估算 出 满足 此 
谓词 的 元 组 个 数 : 将 范围 的 容量 乘 以 范围 的 个 数 ， 即 2x1=2 个 ， 这 个 结果 比 基 于 均匀 分 布 
的 估计 值 要 准确 得 多 。 

等 高 柱状 图 如 图 23-17b 所 示 。 此 时 每 一 栏 的 高 度 为 20( 100/5 ) 。 等 高 柱状 图 也 可 以 压 
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缩 存储 ， 即 只 需 记录 每 个 桶 的 最 大 值 和 最 小 值 ， 以 及 所 有 桶 的 高 度 。 以 谓词 rooms>9 为 例 ， 
利用 等 高 柱状 图 我 们 可 以 估算 出 满足 该 谓词 的 元 组 个 数 为 : ( 1/5 ) X20=4 个 。 对 于 该 谓词 
来 说 ， 利 用 等 高 柱状 图 估算 的 结果 没有 根据 等 宽 柱 状 图 估算 得 准确 。Oracle 采用 等 高 柱状 图 。 
等 高 柱状 图 的 一 个 变形 就 是 假设 桶 的 内 部 分 布 均匀 ,但 是 允许 各 个 桶 的 高 度 有 微小 的 差别 。 

因为 柱状 图 是 持久 化 对 象 ， 所 以 在 存储 和 维护 时 将 引入 额外 的 负载 。 某 些 系统 (例如 微 
软 的 SQL Server) 能 够 自动 创建 和 维护 柱状 图 ， 而 无 需 用 户 的 输入 。 但 是 在 Oracle 中 ， 则 
由 用 户 使 用 PL/SQL 的 包 DBMS_STATS， 负责 为 合适 的 列 创建 和 维护 柱状 图 。 所 谓 合适 的 
列 通常 是 指 那 些 在 SQL 语句 的 WHERE 子 句 中 出 现 的 列 ， 并 且 是 非 均匀 分 布 的 ， 例 如 上 例 
中 的 列 rooms. 


23.7.3 查看 执行 计划 


Oracle 允许 用 户 使 用 EXPLAIN PLAN 命令 查看 优化 器 选择 的 执行 计划 。 如 果 查 询 效率 
不 尽 如 人 意 ， 这 个 方法 将 会 非常 有 用 。EXPLAIN PLAN 的 输出 被 写 和 数据库 中 的 一 个 表 中 
(默认 表 为 PLAN TABLE)。 该 表 主 要 的 列 有 : 

e STATEMENT ID: EXPLAIN PLAN 语句 中 定义 的 可 选 参数 STATEMENT ID 的 值 。 

e OPERATION : 被 执行 的 内 部 运算 的 名 字 。 第 一 行为 实际 的 SQL 语句 : SELECT. 

INSERT、UPDATE 或 者 DELETE。 
OPTIONS: 被 执行 的 另 一 个 内 部 运算 的 名 字 。 
OBJECT _ NAME: 表 或 者 索引 的 名 字 。 
ID: 在 执行 计划 中 为 每 一 步 指派 的 一 个 数字 。 
PARENT_ID: 对 第 ID 步 的 输出 进行 运算 的 下 一 步 的 ID。 
POSITION: 具有 相同 PARENT ID 的 所 有 步 的 处 理 次 序 。 
COST: 运算 的 估计 开销 (对 使 用 基于 规则 的 优化 需 的 语 铅 ，COST EX NULL). 
CARDINALITY: 对 运算 要 访问 的 行 的 数量 的 估计 值 。 

一 个 示例 计划 如 图 23-18 所 示 。 该 计划 中 的 每 一 行 都 代表 着 执行 计划 中 的 一 步 。 输 出 中 

使 用 缩 进来 表示 运算 的 次 序 (注意 列 ID 本 身 并 不 足以 说 明 执行 的 次 序 )。 


EXPLAIN PLAN 
SET STATEMENT_ID = ‘PB’ 
; FOR SELECT b.branchNo, b.city, propertyNo 
4 FROM Branch b, PropertyForRent p 
5 WHERE b.branchNo = p.branchNo 
6 ORDER BY b.city; 


Explained. 


Sot> SELECT IDI|' 'IIPARENT_ ‘Di “LPADC '", 2*(LEVEL ~ 1))||OPERATION||' 'IIOPTIONSI]| 


'IJOBJECT_NAME “Query 
; FROM Plan_Table 
4 START WITH ID = 0 AND STATEMENT_ID = ‘PB’ 
5 CONNECT BY PRIOR ID = PARENT_ID AND STATEMENT _ID = ‘PB’; 


TABLE ACCESS FULL PROPERTYFORRENT 
TABLE ACCESS BY INDEX ROWID BRANCH 
INDEX UNIQUE SCAN SYS_C007455 


rows selected. 





图 23-18 Explain Plan 实用 程序 的 输出 
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本 章 小 结 


查询 处 理 的 目标 是 将 用 高 级 语言 (通常 为 SQL) 表示 的 查询 转换 为 正确 有 效 的 、 用 低级 语言 (例如 
关系 代数 ) 表示 的 执行 策略 ， 并 且 执行 该 策略 以 获取 所 需 检 索 的 数据 。 

由 于 对 于 同一 个 高 级 查询 会 存在 许多 等 价 变换 ， 因 此 DBMS 必须 选择 资源 占用 最 小 的 一 种 。 这 就 
是 查询 优化 的 目的 。 但 当 查 询 涉及 很 多 关系 时 ， 该 问题 计算 起 来 非常 困难 ， 所 以 对 策略 的 选取 通常 
弱化 为 找到 一 个 近似 最 优 方 案 。 

主要 有 两 种 查询 优化 方法 ， 但 是 在 实际 应 用 当中 ,通常 将 这 两 种 方法 结合 起 来 使 用 。 第 一 种 技术 
采用 启发 式 规 则 对 查询 中 的 运算 进行 排序 。 另 外 一 种 技术 则 基于 它们 相对 的 开销 对 不 同 策略 进行 比 
较 ， 然 后 选择 其 中 资源 占用 最 小 的 策略 。 

查询 处 理 被 分 为 四 个 主要 阶段 : 解析 (包括 语法 分 析 和 正确 性 验证 )、 优 化 、 代 码 生 成 和 执行 。 前 三 
个 阶段 要 么 在 编译 时 完成 ， 要 么 在 运行 时 完成 。 

查询 解析 将 高 级 查询 转换 为 关系 代数 查询 ， 并 检验 该 查询 的 语法 、 语 义 是 否 正确 。 查 询 解 析 的 典 
型 阶段 包括 分 析 、 规 范 化 、 语 义 分 析 、 化 简 和 查询 重 构 。 关 系 代数 树 可 用 作 被 转换 的 查询 的 内 部 
表示 。 

查询 优化 运用 转换 规则 将 一 个 关系 代数 表达 式 转 换 为 男 一 个 等 价 的 更 高 效 表 达 式 。 转 换 规则 包括 级 
联 选择 、 一 元 运算 的 交换 律 、9 连接 ( 笛 卡 儿 乘积 ) 的 交换 律 、 一 元 运算 和 9 连接 ( 笛 卡 儿 乘积 ) 的 
交换 律 、6 连接 ( 笛 卡 儿 乘积 ) 的 结合 律 等 。 

启发 式 规则 包括 尽早 执行 选择 和 投影 运算 ; 将 笛 卡 儿 乘积 及 其 后 的 选择 运算 (其 谓词 表示 连接 条 件 ) 
合并 为 一 个 连接 运算 ; 利用 二 元 运算 的 结合 律 对 叶 节 点 重新 排序 ， 使 得 带 有 最 严格 选择 条 件 的 叶 节 
点 最 先 得 到 执行 。 

代价 估算 依赖 于 系统 目录 中 存储 的 统计 信息 。 典 型 的 统计 数据 包括 每 一 个 基础 关系 的 基数 、 存 储 关 
系 所 需 的 块 数 、 每 个 属性 取 不 同 值 的 个 数 、 每 个 属性 的 选择 基数 以 及 每 个 多 级 索引 的 级 数 。 

实现 选择 运算 的 主要 策略 包括 : 线性 搜索 (无 序 文件 、 无 索引 )、 二 分 法 搜索 (有 序 文件 、 无 索引 )、 
散 列 关键 字 上 的 等 值 比较 、 主 关键 字 上 的 等 值 比较 、 主 关键 字 上 的 不 等 值 比较 、 聚 集 ( 辅 ) 索引 上 
的 等 值 比较 、 非 聚集 ( 辅 ) 索引 上 的 等 值 比较 、B*+ 树 辅 索引 上 的 不 等 值 比较 。 


e 实现 连接 运算 的 主要 策略 包括 : RSME. RIEMER, DRAPER ABNER. 


运算 的 物化 输出 是 指 将 输出 结果 存储 在 临时 关系 中 供 后 面 的 运算 处 理 。 与 此 相对 的 方法 是 将 一 个 运 
算 的 结果 流水 到 下 一 个 运算 ， 无 需 创 建 临时 关系 存储 中 间 结 果 ， 从 而 节省 了 创建 临时 关系 和 将 临时 
关系 中 的 结果 再 次 读 回 内 存 的 开销 。 

总 是 以 基础 关系 作为 右 关系 的 关系 代数 树 称 为 左 深 树 。 左 深 树 的 优点 在 于 能 够 缩小 寻找 最 优 策 略 的 
搜索 空间 ， 并 使 查询 优化 融 能 够 利用 动态 处 理 技术 。 其 主要 缺点 是 在 缩小 搜索 空间 的 同时 ， 会 忽略 
一 些 执行 策略 ， 其 中 可 能 有 上 比 线性 树 代价 更 低 的 策略 。 

决定 查询 优化 效率 的 主要 因素 之 一 是 所 有 可 能 的 执行 策略 构成 的 搜索 空间 的 大 小 ， 另 一 个 是 选择 
哪 一 种 枚 举 算 法 来 搜索 该 空间 以 寻找 最 优 策略 。 对 于 某 一 给 定 查询 来 说 ， 该 空间 可 能 非常 巨大 。 因 
此 ,查询 优化 器 采取 了 多 种 办 法 以 缩小 这 个 空间 。 例 如 ， 一 元 运算 可 以 被 即时 处 理 ; 除非 查询 本 身 
指定 ， 和 否则 绝 不 生成 迪 卡 儿 乘 积 ; 每 一 个 连接 的 内 操作 数 都 是 基础 关系 ， 等 等 。 

动态 规划 算法 是 基于 这 样 一 个 假设 : 代价 模型 满足 优化 原则 。 因 此 ， 为 了 得 到 包含 个 连接 的 查 
询 的 最 优 策略 ， 我 们 只 需要 考虑 包含 了 (n-1) 个 连接 的 子 表达 式 的 最 优 策略 ， 然 后 再 对 这 些 策 
略 进行 扩展 ， 添 加 一 个 连接 。 基 于 感 兴趣 序 创建 等 价 类 ， 将 每 一 个 等 价 类 中 具有 最 低 代 价 的 策略 
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保留 下 来 ， 供 下 一 步 使 用 ， 如 此 往复 ， 直 到 构筑 好 整个 查询 ， 据 此 即 选取 了 具有 全 局 最 低 代 价 的 
策略 。 

e 查询 优化 是 RDBMS 性 能 的 关键 ， 必 须 扩展 它 以 使 其 知道 如 何 高 效 执行 用 户 自 定义 函数 ， 如 何 获得 
新 索引 结构 的 便利 性 ， 如 何以 新 的 方式 转换 查询 以 及 如 何 利用 引用 在 数据 之 间 导 航 。 要 将 DBMS 
中 这 样 一 个 关键 、 可 调 的 部 件 成 功 地 开源 化 ， 并 使 第 三 方 理解 优化 技术 ， 这 对 DBMS 开发 商 是 个 
不 小 的 挑战 。 

e 传统 的 RDBMS 利用 B 树 索 引 加 快 对 标量 数据 的 访问 。 而 ORDBMS 具备 定义 复杂 数据 类 型 的 能 
力 ， 因 此 需要 专门 的 索引 结构 以 实现 对 这 类 数据 的 高 效 访问 。 一 些 ORDBMS 已 经 开始 支持 其 他 的 
索引 类 型 ， 例 如 : 通用 B 树 、 能 快速 访问 二 维 或 三 维 数据 的 R 树 (区域 树 ) 和 为 函数 的 输出 构造 索 
引 。 最 灵活 的 方式 是 允许 植 和 人 用户 自 定义 的 任意 索引 结构 。 


思考 题 
23.1 查询 处 理 的 目的 是 什么 ? 
23.2 关系 系统 的 查询 处 理 与 网 状 及 层次 系统 中 的 低级 查询 语言 的 处 理 有 何不 同 ? 
23.3 ”查询 处 理 通常 有 哪些 阶段 ? 
23.4 ”查询 解析 通常 有 哪些 步骤 ? 
23.5 ” 析 取 范式 与 合 取 范式 的 区 别 是 什么 ? 
23.6 ”如 何 检 验 查询 的 语义 正确 性 ? 
23.7 “描述 下 列 运算 的 转换 规则 : 
(a) 选择 运算 
(b) 投影 运算 
(c) 6 连接 运算 
23.8 ”描述 提高 查询 处 理性 能 的 启发 式 规则 。 
23.9 DBMS 应 该 存储 哪些 类 型 的 统计 数据 才能 估算 出 关系 代数 运算 的 开销 ? 
23.10 在 什么 情况 下 执行 选择 运算 ， 系 统 才 会 采取 线性 搜索 策略 ? 
23.11 实现 连接 运算 的 主要 策略 有 哪些 ? 
23.12 ”物化 和 流水 线 技术 的 区 别 是 什么 ? 
23.13 ”讨论 线性 和 非 线 性 关系 代数 树 之 间 的 区 别 ， 并 举例 说 明 。 
23.14 左 深 树 的 优点 和 缺点 是 什么 ? 
23.15 ”讨论 为 全 面 支持 ORDBMA， 查 询 处 理 和 查询 优化 需 作 哪 些 扩 展 ? 


习题 

23.16 fi FF Bi) 23.1 所 述 的 三 种 策略 的 开销 。 假 设 关系 Staff 有 10000 个 元 组 ，Branch 有 500 个 元 组 ， 
共有 500 位 经 理 (Manager)( 每 个 分 公司 一 位 )， 在 伦敦 (London) 共有 10 个 分 公司 。 

23.17 用 第 4 章 习 题 中 给 出 的 Hotel 模式 判断 下 列 哪些 查询 的 语义 是 否 正确 : 


(a) SELECT r.type, r.price 

FROM Room r, Hotel h 

WHERE r.hotel_number = h.hotel_number AND h.hotel_name = ‘Grosvenor Hotel’ AND r.type > | 00; 
(b) SELECT g.guestNo, g.name 

FROM Hotel h, Booking b, Guest g 

WHERE h.hotelNo = b.hotelNo AND h.hotelName = ‘Grosvenor Hotel’; 
(c) SELECT r.roomNo, h.hotelNo 


23.18 


23.19 


23.20 
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FROM Hotel h, Booking b, Room r 
WHERE h.hotelNo = b.hotelNo AND h.hotelNo = 'H21' AND b.roomNo = r.roomNo AND type = ‘S' 
AND b.hotelNo = 'H22’, 


根据 Hotel 模式 ， 画 出 下 列 查询 的 关系 代数 树 ， 然 后 利用 23.3.2 节 给 出 的 局 发 式 规则 将 这 些 查 
询 转 换 为 更 高 效 的 形式 。 给 出 每 一 步 的 详细 描述 ， 并 给 出 所 用 的 转换 规则 。 


(a) SELECT r.roomNo, r.type, r.price 
FROM Room r, Booking b, Hotel h 
WHERE rroomNo = b.roomNo AND b.hotelNo = h.hoteiNo AND 
h.hotelName = ‘Grosvenor Hotel’ AND r.price > 100; 
(b) SELECT g.guestNo, g.guestName 
FROM Room r, Hotel h, Booking b, Guest g 
WHERE h.hotelNo = b.hotelNo AND g.guestNo = b.guestNo AND h.hotelNo = rhotelNo AND 
h.hotelName = ‘Grosvenor Hotel’ AND dateFrom >= 1-jan-08 AND dateTo <= ‘3!-Dec-08’; 


根据 Hotel 模式 ， 假 定 存 在 以 下 索引 : 

e 关系 Room 的 主 关 键 字 属性 roomNo/hotelNo 上 存在 无 溢出 的 散 列 索引 。 
© 关系 Room 的 外 部 关键 字 属 性 hotelNo 存在 聚集 索引 。 

@ 关系 Room 的 属性 price 上 存在 B' 树 索 引 。 

e 关系 Room 的 属性 type 上 存在 辅 索引 。 


nTuples(Room) = 10,000 bFactor(Room) = 200 
nT uples(Hotel) = 50 bFactor(Hotel) = 40 
nTuples(Booking) = 100,000 bFactor(Booking) = 60 
nDistinNCt sens (Room) = 50 

nDistinct,,,.(Room) = 10 

NDistinct,,..(Room) = 500 

Min,ae( Room) = 200 Max,ice( Room) = 50 
nLevels,,teina(!) =2 

nLevels,;..(l) = nLfBlocks,;..(l) = 50 


(a) 计算 下 列 选择 运算 的 基数 和 最 小 代价 : 


Sl: GroomNo=! a hoteiNo= H001 (Room) 
S2: Fype~p (Room) 

S3: Thoteino= H07 (Room) 

S4: Oyicesioo(RoomM) 

S5: Oiype='s A hoteio= H03 (Room) 

S6: Diype=s' v price < 100(ROOM) 


(b) 计算 下 列 连接 运算 的 基数 和 最 小 代价 : 


Jl: Hotel pae Room 
J2: Hotel ™ aneno Booking 
J3: Room ™4 somno Booking 
|4 Room mw, Hotel 

|S: Booking ™oteio Hotel 
J6: Booking ™ vomo Room 


(c) 计算 下 列 投影 运算 的 基数 和 最 小 开销 : 


Pl: 也 ,Nas(Hotel) 

P2: Th creinio(FROom) 

P3: [l,i(Room) 

P4: IL,,,.(Room) 

P5: Ioe, priced ROOM) 


修改 23.4.3 节 介 绍 的 块 持 套 循 环 连接 算法 和 索引 艇 套 循环 连接 算法 ， 使 算法 从 原来 的 每 次 从 外 
KA R 中 读 取 1 块 变 为 每 次 读 取 (nBuffer-2 ) 块 。 
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Database Systems: A Practical Approach to Design, Implementation, and Management, 6E 


DreamHome 案例 研究 的 用 户 需 求 说 明 


| 本 附录 目标 
本 附录 我 们 主要 学 习 : 
e 给 出 11.4 节 所 讨论 的 DreamHome 案例 研究 的 两 个 用 户 视 图 Branch 和 Staff 的 数据 
需求 和 事务 需求 


本 附录 描述 了 DreamHome 数据 库 系统 中 Branch 和 Staff 两 个 用 户 视图 的 用 户 需 求 说 
明 。 每 个 视图 的 需求 都 包括 两 部 分 ,“ 数 据 需 求 ”部 分 描述 了 用 到 的 数据 , “数据 事务 ”部 分 
给 出 了 使 用 数据 的 例子 。 


A.1 DreamHome 的 Branch 用 户 视 图 
A.1.1 数据 需求 


DreamHome 的 分 公司 遍布 英国 的 所 有 城市 。 每 个 分 公司 分 得 的 员工 中 都 包括 一 名 经 理 ， 
他 管理 该 分 公司 的 运转 。 描 述 一 个 分 公司 的 数据 包括 唯一 的 分 公司 编号 、 地 址 (街道 、 城 市 
和 邮编 )、 电 话 号 码 (最 多 可 有 3 个 电话 号 码 ) 和 当前 管理 该 分 公司 的 员工 的 名 字 。 特 别 附加 
在 每 名 经 理 上 的 数据 包括 : 经 理 在 当前 分 公司 任职 的 日 期 ， 以 及 根据 他 每 月 在 房产 租赁 市 场 
的 业绩 获得 的 奖金 。 
员工 

担任 主管 工作 的 员工 负责 管理 本 组 内 其 他 助理 员工 的 日 常 活动 (每 组 最 多 10 人 )。 并 不 
是 所 有 员工 都 有 一 名 主管 。 为 每 个 员工 存储 的 数据 包括 员工 编号 、 地 址 、 职 务 、 工 资 和 主管 
BF AEN) 和 该 员工 当前 工作 的 分 公司 的 情况 。 员 工 编号 在 DreamHome 所 有 分 公 
司 内 都 是 唯一 的 。 
出 租 的 房产 

每 个 分 公司 提供 一 批 用 于 出 租 的 房产 。 为 每 处 房产 存储 的 数据 包括 房产 编号 、 地 址 ( 街 
道 、 城 市 和 邮编 )、 类 型 、 房 间 数 目 、 每 月 租金 和 业主 情况 。 房 产 编号 在 所 有 分 公司 内 都 是 
唯一 的 。 每 处 房产 分 派 给 一 位 员工 管理 ， 他 负责 处 理 房产 出 租 的 有 关 事 宜 。 任 何 时 候 一 位 员 
工 管理 的 房产 数目 最 多 不 超过 100 处 。 
业主 

业主 的 情况 同样 也 被 存储 起 来 。 业 主 有 两 种 主要 类 型 : 私人 业主 和 企业 业主 。 为 私人 业 
主 存储 的 数据 包括 业主 编号 、 名 字 、 地 址 和 电话 号 码 。 为 企业 业主 存储 的 数据 包括 企业 的 名 
称 、 企 业 的 类 型 、 地 址 、 电 话 号 码 和 联系 人 。 
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客户 

DreamHome 把 对 租房 感 兴 趣 的 人 称 为 客户 。 客 户 必须 首先 在 DreamHome 的 分 公司 注 
册 。 为 客户 存储 的 数据 包括 客户 编号 、 名 字 、 电 话 号 码 、 喜 欢 的 住所 类 型 和 客户 最 多 准备 支 
付 的 租金 。 同 时 还 存储 了 负责 的 员工 的 名 字 、 客 户 加 入 的 日 期 和 客户 注册 所 在 分 公司 的 某 些 
情况 。 客 户 编号 在 DreamHome 所 有 分 公司 内 都 是 唯一 的 。 
租约 

当 房 产 出 租 时 ， 客 户 和 业主 之 间 就 会 草拟 一 份 租 约 。 租 约 上 的 具体 数据 包括 租约 编号 、 
客户 编号 、 名 字 和 地 址 、 房 产 编号 和 地 址 、 每 月 租金 、 付 款 方法 、 定 金 是 否 支 付 (定金 是 月 
租 的 两 倍 )、 租 约 的 持续 时 间 ， 以 及 租约 开始 和 结束 的 日 期 。 
报纸 


需要 时 ， 在 当地 报纸 上 刊登 广告 介绍 出 租房 产 的 情况 。 存 储 的 数据 包括 房产 编号 、 地 
址 、 类 型 、 房 间 数 量 、 和 租金、 广告 日 期 、 报 纸 名 字 和 费用 。 为 每 一 份 报纸 存储 的 数据 包括 报 
纸 名 字 、 地 址 、 电 话 号 码 和 联系 人 。 


A.1.2 事务 需求 (示例 ) 
数据 录 人 / 
录入 一 个 新 分 公司 的 情况 (比如 格拉 斯 哥 市 的 分 公司 B003 )。 
录 人 某 个 分 公司 中 一 名 新 员工 的 情况 (比如 分 公司 B003 AY Ann Beech). 
录入 客户 和 房产 之 间 租 约 的 情况 (比如 客户 Mike Ritchie 租 下 编号 为 PG4 的 房产 ， 时 
间 从 2012 Æ 5 H 10 日 到 2013 年 5 月 9 日 )。 
录入 在 报纸 上 刊登 房产 广告 的 情况 (比如 编号 为 PG4 的 房产 的 广告 刊登 在 2012 年 5 月 
6 日 格拉 斯 哥 市 的 日 报 上 )。 
数据 更 新 / 删除 
更 新 /删除 某 分 公司 的 情况 。 
更 新 /删除 工作 在 某 分 公司 的 一 名 员工 的 情况 。 
更 新 /删除 给 定 分 公司 的 给 定 租约 的 情况 。 
更 新 /删除 给 定 分 公司 的 报纸 广告 的 情况 。 
数据 查询 
用 于 Branch 视图 查询 的 例子 如 下 所 示 : 
(a) 列 出 给 定 城市 所 有 分 公司 的 情况 。 
(b) 确定 每 个 城市 分 公司 的 总 数 。 
(c) 按 员 工 的 名 字 顺 序 ， 列 出 给 定 分 公司 员工 的 名 字 、 职 务 和 工资 。 
(d) 确定 员工 的 总 数 和 他 们 工资 的 总 和 。 
(e) 确定 格拉 斯 哥 市 的 分 公司 中 每 一 职务 的 员工 人 数 。 
(£) 按 分 公司 的 地 址 顺序 ， 列 出 每 个 分 公司 中 每 名 经 理 的 名 字 。 
(g) 列 出 被 命名 为 主管 的 员工 的 名 字 。 
(h) 按 租金 的 多 少 ， 列 出 格拉 斯 哥 市 所 有 房产 的 编号 、 地 址 、 类 型 和 租金 。 
(i) 列 出 某 具 名 员工 管理 的 待 出 租房 产 的 情况 。 
G) 确定 某 分 公司 分 派 给 每 位 员工 的 房产 总 数 。 
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(k) 列 出 某 分 公司 中 由 企业 业主 提供 的 房产 的 情况 。 

(1) 确定 所 有 分 公司 中 每 一 类 房产 的 总 数 。 

(m) 确定 提供 多 处 房产 出 租 的 私人 业主 的 情况 。 

(n) 确定 阿 介 丁 市 中 至 少 带 有 3 个 房间 且 月 租 不 高 于 350 英镑 的 公寓 数目 。 
(0) 列 出 给 定 分 公司 中 客户 的 编号 、 名 字 、 电 话 号 码 和 他 们 喜欢 的 房产 类 型 。 
(P) 列 出 刊登 广告 次 数 多 于 平均 次 数 的 房产 。 

(q) 列 出 茶 分 公司 到 下 个 月 期 满 的 租约 情况 。 

(r) 列 出 伦敦 市 分 公司 中 租 期 少 于 一 年 的 房产 的 总 数 。 

(s) 按 分 公司 编号 排列 ， 列 出 每 个 分 公司 每 天 出 租房 产 的 全 部 租金 收入 。 


A.2 DreamHome 的 Staff 用 户 视图 


A.2.1 数据 需求 


员工 

关于 员工 ,需要 存储 的 数据 包括 员工 编号 、 名 字 (名 和 姓 )、 职 务 、 性 别 、 出 生日 期 
(DOB) 和 主管 名 字 (车 存在 的 话 )。 担 任 主管 工作 的 员工 负责 管理 本 组 其 他 助理 员工 的 日 党 
活动 (每 组 最 多 10 A). 
出 租 的 房产 

为 出 租 的 房产 存储 的 数据 包括 房产 编号 、 地 址 (街道 、 城 市 和 邮编 )、 类 型 、 房 间 数 量 、 
月 租金 和 业主 情况 。 房 产 的 月 租金 每 年 进行 一 次 复审 。DreamHome 中 用 于 出 租 的 房产 大 多 
数 是 公寓 。 每 处 房产 分 配给 一 位 员工 管理 ， 它 负责 处 理 房产 出 租 的 有 关 事 宜 。 任 何 时 候 ， 一 
位 员工 管理 的 房产 数 最 多 不 超过 100 处 。 
业主 

业主 有 两 种 主要 类 型 : 私人 业主 和 企业 业主 。 为 私人 业主 存储 的 数据 包括 业主 编号 、 名 
字 (名 和 姓 )、 地 址 和 电话 号 码 。 为 企业 业主 存储 的 数据 包括 业主 编号 、 企 业 的 名 字 、 企 业 
的 类 型 、 地 址 、 电 话 号 码 和 联系 人 。 
客户 

当 潜在 客户 注册 时 ，DreamHome 中 存储 的 数据 包括 客户 编号 、 名 字 ( 姓 和 名 )、 电 话 号 
码 及 所 需 房产 的 一 些 数据 ， 包 括 喜 欢 的 住所 类 型 和 客户 最 多 准备 支付 的 租金 。 同 样 也 存储 负 
责 注 册 新 客户 的 员工 的 名 字 。 
看 房 

客户 可 能 要 求 看 房 。 此 时 ， 存 储 的 数据 包括 客户 编号 、 名 字 和 电话 号 码 、 房 产 编号 和 地 
址 、 客 户 看 房 的 日 期 和 客户 对 房产 合适 与 否 所 做 的 任何 评论 。 客 户 在 一 个 日 期 只 能 查看 相同 
的 房产 一 次 。 
租约 

只 要 客户 发 现 合适 的 房产 ， 就 草拟 租约 。 租 约 信息 包括 租约 编号 、 客 户 编号 和 名 字 、 房 
产 编号 、 地 址 、 类 型 和 房间 数量 、 月 租 、 付 款 方法 、 定 金 (为 月 租 的 两 倍 )、 定 金 是 否 支 付 、 
出 租 开 始 和 结束 的 日 期 和 租约 持续 时 间 。 租 约 编号 在 所 有 的 DreamHome 分 公司 内 都 是 唯一 
的 。 一 个 客户 可 能 拥有 给 定 房产 租约 的 期 限 最 少 为 3 个 月 ， 最 多 为 1 年 。 


Ht A DreamHome HFR MHAP ERMA 571 


A.2.2 事务 需求 (示例 ) 


数据 录入 

录入 待 租 新 房产 及 其 业主 的 情况 (例如 Tina Murphy 所 有 的 在 格拉 斯 哥 市 ， 编 号 为 PG4 
的 房产 情况 )。 i 

录入 一 名 新 客户 的 情况 (比如 Mike Ritchie 的 情况 )。 

录入 一 名 客户 查看 房产 的 情况 (比如 客户 Mike Ritchie 在 2012 年 5 月 6 日 查看 格拉 斯 
哥 市 编号 为 PG4 的 房产 )。 

录入 客户 对 房产 签 租约 的 情况 〈( 比 如 客户 Mike Ritchie 租借 了 编号 为 PG4 的 房产 ， 时 间 
从 2012 年 5 月 10 日 到 2013 年 5 月 9 日 )。 
数据 更 新 / 删除 

更 新 /删除 一 处 房产 的 情况 。 

更 新 /删除 一 名 业主 的 情况 。 

更 新 /删除 一 名 客户 的 情况 。 

更 新 /删除 一 名 客户 查看 过 的 一 处 房产 的 情况 。 

更 新 / 删除 一 份 租约 的 情况 。 
数据 查询 

用 于 Staff 视图 查询 的 例子 如 下 所 示 : 

(a) 列 出 分 公司 被 任命 为 主管 的 员工 的 情况 。 

(b) 按 名 字 在 字母 表 中 的 顺序 列 出 所 有 助理 的 情况 。 

(c) 列 出 分 公司 可 供出 租 的 房产 的 情况 (包括 出 租 定金 )， 包 括 业 主 的 情况 。 

(d) 列 出 分 公司 中 由 某 名 员工 管理 的 房产 的 情况 。 

(e) 列 出 在 分 公司 注册 客户 的 情况 和 负责 注册 客户 的 员工 的 名 字 。 

(f) 确定 位 于 格拉 斯 哥 市 且 租金 不 高 于 450 英镑 的 房产 的 数量 。 

(g) 确定 给 定 房产 的 业主 的 名 字 和 电话 号 码 。 

(h) 列 出 客户 查看 过 给 定 房产 后 所 做 的 评论 情况 。 

(i) 列 出 查看 过 给 定 房产 但 没有 做 出 评论 的 客户 的 名 字 和 电话 号 码 。 

G) 列 出 某 客户 与 给 定 房产 之 间 租 约 的 情况 。 

(k) 确定 分 公司 到 下 个 月 期 满 的 租约 的 数量 。 

(1) 列 出 出 租 不 超过 三 个 月 的 房产 的 情况 。 

(m) 生成 喜欢 特定 房产 类 型 的 客户 的 列表 。 


附录 B | 
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附录 目标 

本 附录 我 们 主要 学 习 : 

© 大 学 住宿 管理 处 ( University Accommodation Office) 案例 研究 ， 它 描述 了 大 学 住宿 
管理 处 的 数据 需求 和 事务 需求 

© 易 驾 驾校 (EasyDrive School of Motoring) 案例 研究 ， 它 描述 了 驾驶 学 校 的 数据 需求 
和 事务 需求 

© Wellmeadows 医院 案例 研究 ， 它 描述 了 医院 的 数据 需求 和 事务 需求 


附录 B.1 节 描 述 大 学 住宿 管理 处 案例 研究 ，B.2 节 描 述 易 驾 驾校 案例 研究 ，B.3 节 描 述 
Wellmeadows 医院 案例 研究 。 


B.1 大 学 住宿 管理 处 案例 研究 


大 学 住宿 管理 处 主任 希望 设计 一 个 数据 库 来 帮助 进行 管理 工作 。 通 过 数据 库 设 计 过 程 中 
需求 收集 和 分 析 阶 段 的 工作 ， 提 出 如 下 关于 大 学 住宿 管理 处 数据 库 系统 的 数据 需求 说 明 ， 以 
及 该 数据 库 能 支持 的 查询 事务 的 示例 。 


B.1.1 数据 需求 
学 生 . 

为 每 位 全 日 制 学 生存 储 的 数据 包括 : 学 号 、 名 字 (名 和 姓 )、 家 庭 地 址 (街道 、 城 市 、 邮 
编 )、 手 机 号 、 电 子 邮箱 号 、 出 生日 期 、 性 别 、 学 生 类 别 (例如 ， 大 学 一 年 级 学 生 或 研究 生 )、 
国籍 、 特 殊 需 求 、 任 何 附 加 备注 、 当 前 状况 (已 安排 或 处 于 等 待 中 )、 专 业 和 辅修 科目 。 

存储 的 学 生 信息 与 该 学 生 是 已 租房 还 是 正在 等 待 队 列 等 待 有 关 。 学 生 可 能 租 住 集体 宿舍 
或 学 生 公寓 。 

当 学 生 进 入 大 学 时 ， 就 会 指派 一 名 教员 工 充当 他 的 指导 教师 。 指 导 教 师 的 作用 就 是 保证 
学 生 在 校 期 间 的 福利 ， 并 监督 他 们 的 学 业 。 为 指导 教师 存储 的 数据 包括 全 名 、 职 位 、 部 门 名 
称 、 内 部 电话 、 电 子 邮箱 号 和 房间 号 。 
集体 宿舍 

每 座 集体 宿舍 有 和 名字、 地 址 、 电 话 号 码 和 管理 宿舍 业务 的 管理 员 。 宿 舍 只 提供 单间 ， 具 
有 房间 号 、 床 位 号 和 月 租金 。 

床位 号 唯一 标识 由 住宿 管理 处 管理 着 的 每 个 房间 ， 并 且 仅 当 房 间 租 给 一 个 学 生 时 才 
启用 。 
FEAN 

住宿 管理 处 也 可 以 提供 学 生 公寓 。 这 些 公寓 装修 良好 ， 可 以 提供 一 套房 间 给 三 名 、 四 名 
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或 五 名 学 生 合 住 。 学 生 公寓 存储 的 信息 包括 公寓 号 、 地 址 和 每 套 公寓 可 用 的 卧室 数目 。 公 寓 
号 唯一 地 标识 每 座 公寓 。 

公寓 中 的 每 个 卧室 有 月 租金 、 房 间 号 和 床位 号 。 床 位 号 唯一 标识 整个 学 生 公寓 中 每 个 可 
用 的 房间 ， 并 且 仅 当 房 间 租 给 一 个 学 生 时 才 启 用 。 
租约 

学 生 可 以 在 不 同 的 时 间 段 租用 集体 宿舍 或 学 生 公 寓 的 房间 。 新 租约 协定 从 每 一 学 年 开 
始 ， 最 短 租 期 为 一 学 期 ; 最 长 租 期 为 一 年 ， 包 括 两 个 长 学 期 和 夏季 学 期 。 学 生 和 住宿 管理 处 
之 间 的 个 人 租约 协议 可 由 租约 号 唯一 标识 。 

每 个 租约 存储 的 数据 包括 租约 号 、 租 约 持续 时 间 (以 学 期 为 单位 )、 学 生 名 字 和 入 学 号 、 
床位 号 、 房 间 号 、 集 体 宿舍 或 学 生 公寓 地 址 情况 、 学 生 打算 入 住房 间 的 日 期 和 学 生 打 算 退 房 
的 日 期 (如 果 能 确定 )。 
账单 

每 学 期 开始 ， 每 个 学 生 收 到 一 张 关于 下 一 租用 期 的 账单 。 每 张 账单 有 唯一 的 账单 号 。 

每 张 账 单 存 储 的 数据 包括 账单 号 、 租 约 号 、 学 期 、 支 付 期 限 、 学 生 全 名 和 入 学 号 、 床 位 
号 、 房 间 号 和 集体 宿舍 或 学 生 公寓 的 地 址 。 账 单 上 还 有 一 些 关 于 付款 的 数据 ， 包 括 账单 支付 
的 日 期 、 支 付 方法 (支票 、 现 金 、 信 用 卡 等 )， 以 及 催 询 单 第 一 次 和 第 二 次 送 到 的 日 期 (如果 
必要 的 话 )。 

学 生 公寓 检查 

学 生 公寓 由 员工 定期 检查 以 确保 住宿 条 件 良 好 。 每 次 检查 记录 的 信息 包括 执行 检查 的 员 
工 编号 、 检 查 的 日 期 、 房 间 是 否 处 于 满意 状况 的 标识 (是 或 不 是 ) 和 附加 的 评论 。 

住 答 管 理 处 员工 | 

关于 工作 在 住宿 管理 处 的 员工 ， 存 储 的 信息 包括 员工 编号 、 名 字 《〈 姓 和 名 六 电子 邮箱 
号 、 家 庭 地 址 街道、 城市、 邮编)、 出 生日 期 、 性 别 、 职 务 〈 公 寓 经 理 、 行 政 助理 、 清 少 
T) 和 办 公 地 点 《〈 例 如， 住宿 管理 处 或 宿舍 )。 
课程 

住宿 管理 处 也 存储 大 学 所 开课 程 的 有 限 信息 ， 包 括 课程 编号 、 课 程 名 称 (包括 学 年 )、 
授课 人 、 授 课 人 的 校内 电话 、 电 子 邮箱 号 、 房 间 号 和 系 名 。 每 名 学 生 与 一 个 教程 关联 。 


家 属 


可 能 的 情况 下 ， 也 要 存储 学 生 家 属 的 一 些 信息 ， 包 括 名 字 、 与 学 生 的 关系 、 地 址 〈 街 
道 、 城 市 、 邮 编 ) 和 联系 电话 。 


B.1.2 ”查询 事务 (示例 ) 


下 面 给 出 大 学 住宿 管理 处 数据 库 系统 应 支持 的 查询 事务 的 一 些 示 例 : 
(a) 列 出 每 一 个 集体 答 舍 的 经 理 的 姓名 和 电话 号 码 。 

(b) 给 出 所 有 租约 一 览 表 ， 包 括 学 生 的 名 字 和 学 号 以 及 租约 细节 。 
(c) 显示 夏季 学 期 的 租约 情况 。 

(d) 显示 指定 学 生 文 付 租金 的 全 部 情况 。 

(e) 给 出 某 日 期 前 未 支付 租金 的 学 生 的 一 览 表 。 
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(£) 显示 公寓 检查 处 于 不 满意 状况 的 公寓 的 情况 。 

(g) 提交 住 在 某 一 集体 宿舍 中 学 生 的 名 字 、 学 号 、 房 间 号 和 床位 号 的 一 览 表 。 

Ch) 给 出 当前 所 有 等 待 住宿 的 学 生 ， 即 尚未 安置 住宿 的 学 生 的 列表 。 

(i) 显示 每 类 学 生 的 总 人 数 。 

G) 给 出 所 有 未 提供 家 属 情况 的 学 生 的 名 字 和 学 号 的 列表 。 

(k) 显示 指定 学 生 的 顾问 的 名 字 和 校内 电话 。 

(1) 显示 集体 宿舍 房租 的 最 小 值 、 最 大 值 和 平均 值 。 

(m) 显示 每 处 学 生 公 寓 中 床位 的 总 数 。 

(n) 显示 所 有 年 龄 超过 60 周岁 的 住宿 管理 处 员工 的 员工 编号 、 名 字 、 年 龄 和 当前 办 公 地 点 。 


B2 易 驾 驾校 案例 研究 


易 驾 驾校 1992 年 始 建 于 格拉 斯 哥 市 。 从 那 时 起 ， 学 校规 模 稳定 增长 ， 现 已 有 若干 分 校 
遍布 于 苏格兰 的 各 主要 城市 。 可 是 ， 驾 校规 模 增长 如 此 之 快 ， 以 至 于 需要 越 来 越 多 的 行政 人 
员 来 处 理 日 益 增 长 的 文书 工作 。 而 且 ， 各 分 校 之 间 ， 甚 至 处 在 同一 个 城市 的 分 校 之 间 信 息 的 
交流 和 共享 都 非常 匮乏 。 驾 校 的 校长 Dave MacLeod 认为 ， 如 果 不 改善 这 种 状况 就 会 有 越 来 
越 多 的 错误 发 生 ， 而 且 驾 校 的 生命 力也 不 强 。 他 知道 数据 库 能 帮助 解决 部 分 问题 ， 所 以 希望 
创建 数据 库 系统 以 支持 易 驾 驾校 的 运行 。 关 于 易 驾 驾校 系统 应 如 何 操作 ， 校 长 提供 了 下 面 的 
简单 描述 。 


B.2.1 数据 需求 


每 个 分 校 配 有 一 名 校长 (他 一 般 也 是 高 级 教练 )、 几 位 高 级 教练 、 教 练 和 若干 行政 人 员 。 
分 校 校长 负责 该 分 校 每 天 的 运营 情况 。 驾 校 学 员 必 须 首先 在 学 校 登记 ， 登 记 时 要 求 填 好 申请 
表 ， 记 录 个 人 情况 。 第 一 次 上 课 前 ， 学 员 必 须 参加 由 教练 组 织 的 面试 ， 以 获取 该 学 员 的 特殊 
需求 ， 并 了 解 其 是 否 已 持 有 有 效 的 临时 驾驶 执照 。 驾 校 学 员 在 学 习 驾 驶 的 过 程 中 ， 可 以 自由 
指定 教练 或 请 求 更 换 教 练 。 面 试 以 后 ， 预 约 第 一 节 课 ， 学 员 可 以 要 求 上 单 人 班 或 费用 较 少 的 
多 人 班 。 单 人 班 每 次 一 小 时 ， 以 到 学 校 的 时 间 开始 计时 ， 离 开学 校 时 结束 计时 。 一 节 课 在 定 
长 的 时 间 内 ， 有 指定 的 教练 和 专车 。 所 有 课 最 早上 午 8 点 开始 ， 最 晚 下 午 8 点 结束 。 一 节 课 
后 ， 教 练 记 录 学 员 的 学 习 情 况 和 课 答 上 行驶 的 英里 数 。 学 校 有 很 多 车 ， 主 要 用 来 教学 ， 每 个 
教练 被 分 配 到 指定 的 车 上 。 除 用 于 教学 外 ， 教 练 个 人 可 以 免费 使 用 这 些 车 辆 。 驾 校 学 员 完 成 
了 全 部 课程 后 ， 就 可 以 申请 驾驶 测试 的 日 期 。 为 了 取得 驾驶 执照 ， 轰 校 学 员 必 须 通 过 实践 和 
理论 两 部 分 测试 。 教 练 的 责任 是 确保 驾校 学 员 对 测试 进行 充分 的 准备 ， 但 不 负责 测试 学 员 ， 
而 且 测 试 时 不 能 待 在 车 上 , 但 是 教练 应 该 在 测试 中 心 接送 驾校 学 员 。 如 果 驾 校 学 员 未 能 通过 
考试 ， 教 练 必须 记录 未 通过 考试 的 原因 。 


B.2.2 ”查询 事务 (示例 ) 


校长 提供 了 易 驾 驾校 数据 库 系统 中 必须 支持 的 一 些 典 型 查询 的 例子 : 
(a) 所 有 分 校 校 长 的 名 字 和 电话 号 码 。 

(b) 位 于 格拉 斯 哥 市 的 所 有 分 校 的 地 址 。 

(c) 在 格拉 斯 哥 市 的 贝尔 斯 登 分 校 工 作 的 所 有 女 教练 的 名 字 。 

(d) 每 个 分 校 的 员工 总 数 。 
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(e) 每 个 城市 中 驾校 学 员 (过 去 和 现在 ) 的 总 数 。 

(f) 下 周 某 个 教练 预约 的 时 间 表 。 

(g) 某 教 练 进行 面试 的 情况 。 

Ch) 格拉 斯 哥 市 贝尔 斯 登 分 校 男女 学 员 的 总 人 数 。 

(i) 年 龄 超过 55 周岁 且 担 任教 练 的 员工 的 人 数 和 和 名字。 

(j) 没有 发 生 故 障 的 汽车 的 牌照 号 。 

(k) 由 格拉 斯 哥 市 贝尔 斯 登 分 校 的 教练 所 使 用 汽车 的 牌照 号 。 
(1) 2013 年 1 月 通过 汽车 驾驶 测试 的 驾校 学 员 名 单 。 

(m) 参加 三 次 以 上 驾驶 测试 仍 没有 通过 的 驾校 学 员 的 名 单 。 
(n) 一 小 时 课程 驾驶 的 平均 英里 数 。 

(o) 每 个 分 校 的 行政 人 员 的 数目 。 


B.3 Wellmeadows 医院 案例 研究 


本 案例 研究 描述 了 一 个 位 于 爱丁堡 的 名 为 Wellmeadows 的 小 型 医院 。Wellmeadows E 
院 擅长 于 老年 人 的 健康 护理 。 下 面 是 医院 员工 记录 、 维 护 和 访问 的 数据 的 描述 ， 用 于 支持 
Wellmeadows 医院 的 日 常 管理 和 操作 。 


B.3.1 数据 需求 


病房 

Wellmeadows 医院 有 17 间 病 房 ， 共 有 240 个 病床 用 于 短期 和 长 期 住院 的 病人 ， 还 有 一 
个 门诊 部 。 每 个 病房 可 以 用 病房 号 〈《 例 如， 病房 11 ) 唯一 标识 ， 此 外 还 有 病房 名 字 ( 例 如， 
牙科 )、 位 置 (例如 ,，E 区 )、 病 床 总 数 和 电话 分 机 号 〈 例 如， 分 机 7711 )。 
员工 

Wellmeadows 医院 有 一 名 医务 主任 ,负责 医院 的 全 面 管 理 。 他 完全 控制 医院 资源 的 使 用 
(包括 医护 人 员 、 病 床 、 供 给 药品 ) 以 对 所 在 病人 进行 经 济 的 治疗 。 

Wellmeadows 医院 有 一 名 人 事 部 主任 ,负责 把 合适 数量 和 类 型 的 员工 分 配 到 每 个 病房 和 
门诊 部 。 为 每 个 员工 存储 的 信息 包括 员工 编号 、 和 名字 ( 姓 和 名)、 详 细 地 址 、 电 话 号 码 、 出 
生日 期 、 性 别 、 国 家 保险 号 、 职 务 、 当 前 工资 和 工资 级 别 。 同 时 ， 还 包括 每 位 员工 的 资格 证 
(包括 发 证 日 期 、 类 型 和 发 证 机 构 ) 和 工作 经 历 (包括 组 织 名 字 、 职 务 、 开 始 和 结束 日 期 )。 

每 个 员工 雇用 合同 类 型 也 需要 记录 ， 包 括 每 周 工 作 的 小 时 数 、 员 工 是 专职 还 是 兼职 、 
支付 工资 的 类 型 ( 按 周 / 按 月 )。 例 如 ，Wellmeadows 医院 在 11 号 病房 工作 的 员工 Moira 
Samuel 的 登记 表 如 图 B-1 所 示 。 

每 个 病房 和 门诊 部 都 有 一 位 担任 护士 长 的 员工 。 护 士 长 负责 查看 病房 和 门诊 部 每 天 的 运 
行情 况 。 护 士 长 对 病房 进行 预算 ， 必 须 确 保 所 有 资源 (员工 、 病 床 和 供给 药品 ) 在 病人 护理 
时 得 到 高 效 使 用 。 医 务 主任 的 工作 和 护士 长 紧密 相连 以 确保 整个 医院 的 高 效 运作 。 

护士 长 负责 安排 周 值班 表 ， 必 须 确 保 病 房 和 门诊 部 无 论 在 任何 时 间 都 有 合适 数量 和 类 型 
的 员工 在 值班 。 一 周 内 ， 每 位 员工 轮流 值 早 、 中 或 晚 班 。 

和 护士 长 一 样 ， 每 个 病房 分 配 中 级 和 初级 护士 、 医 生 和 辅助 人 员 。 专 业 员 工 (例如 ， 咨 
询 人 员 和 理疗 人 员 ) 也 被 分 配给 一 些 病房 或 门诊 部 。 例 如 ，Wellmeadows 医院 分 配给 11 号 
病房 的 员工 的 详细 情况 一 览 表 如 图 B-2 所 示 。 





图 B-l Wellmeadows 医院 员 THER ` 
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图 B-2 Wellmeadows 医院 病房 员 工 一 览 表 的 第 一 页 
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病人 
病人 一 旦 进入 医院 ， 就 会 分 配 到 唯一 的 病人 号 。 同 时 ,病人 的 其 他 信息 也 要 记录 ， 包 
括 名 字 ( 姓 和 名 )、 地 址 、 电 话 号 码 、 出 生日 期 、 性 别 、 婚 姻 状 况 、 住 院 日 期 和 病人 家 属 的 
情况 。 yA 
病人 家 属 | : Ns 
病人 家 属 的 情况 需要 记录 ， 包括 家 属 的 全 名 、 和 病人 的 关系 、 地 址 、 电话 号 码 。 
社区 医生 


病人 通常 由 社区 医生 送 到 医院 。 社 区 医生 的 情况 需要 记录 ， 包括 他 们 的 全 名 、 诊所 号 、 
地 址 和 电话 号 码 。 诊 所 号 在 全 英国 是 唯一 的 。Wellmeadows Renney Anne a 
详细 情况 的 登记 表 如 图 B-3 所 示 。 





图 B-3 Wellmeadows 医院 病人 登记 表 


病人 约 查 
病人 被 他 的 社区 医生 送 到 Wellmeadows 医院 后 ， 就 会 预约 一 次 由 医院 咨询 专家 进行 的 
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检查 。 每 次 约 查 都 有 唯一 的 约 查 号 。 记 录 每 名 病人 约 查 的 情况 ， 包 括 进 行 此 次 检查 的 专家 的 
名 字 和 员工 编号 、 约 查 日 期 和 时 间 及 约 查 房 间 (例如 ， 房间 E252 )。 

检查 结果 将 确定 病人 是 送 到 门诊 就 诊 还 是 住院 就 诊 。 
门诊 病人 

门诊 病人 的 情况 需要 存储 ， 包 括 病人 号 、 名 字 ( 姓 和 名 )、 地 址 、 电 话 号 码 、 出 生日 期 、 
性 别 、 在 门诊 部 约 诊 的 日 期 和 时 间 。 
住院 病人 

护士 长 和 其 他 高 级 医护 人 员 负 责 为 病人 分 配 病床 。 当 前 已 安置 在 病房 和 在 等 待 安置 的 
病人 情况 需要 记录 ,包括 病人 号 、 名 字 ( 姓 和 名 )、 地 址 、 电 话 号 码 、 出 生日 期 、 性 别 、 婚 
姻 状 况 、 病 人 家 属 的 情况 、 放 置 在 等 待 队列 中 的 日 期 、 所 需 的 病房 、 硕 望 住院 的 时 间 GRR 
计 )、 住 院 日 期 、 出 院 日 期 和 实际 出 院 日 期 ( 若 能 确定 的 话 )。 

病人 住 进 病房 时 ， 被 分 配 一 个 病床 且 具 有 唯一 的 病床 号 。 被 分 配 到 11 号 病房 的 病人 的 
详细 情况 一 览 表 如 图 B-4 所 示 。 





图 B-4 Wellmeadows 医院 某 病 房 病 人 一 览 表 的 第 一 页 


病人 的 药方 

给 病人 开 药 时 ， 有 关 情 况 需 要 记录 ， 包 括 病 人 名 字 和 病人 号 、 药 品 数 量 和 名 称 、 每 天 
服用 的 次 数 、 服 用 方法 〈 例 如 ， 口 服 、 静 肪 注射 )、 开 始 和 结束 的 上 日期。 给 每 位 病人 的 药品 
应 得 到 控制 。Wellmeadows 医院 用 于 记录 病人 Robert MacDonald 的 用 药 情 况 表 如 图 B-5 
所 示 。 
治疗 品 和 非 治疗 品 供应 

Wellmeadows 医院 有 一 个 治疗 (例如 ,注射器 、 消 毒剂 ) 和 非 治 疗 ( 例 如， 塑料 袋 、 围 
H) 医疗 用 品 的 中 心 库 。 医 疗 用 品 的 信息 包括 物品 号 和 名 字 、 物 品 说 明 书 、 库 存 数 量 、 再 订 
购 级 别 和 单价 。 用 品 号 可 以 唯一 标识 每 类 治疗 用 和 非 治疗 用 医疗 物品 。 每 个 病房 所 用 医疗 用 
品 都 会 得 到 监控 。 
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Wellmeadows Hospital 
Patient Medication Form 


Patient Number: 710024 







Full Name Robert MacDonald Ward Number Ward 11 


Bed Number 84 Ward Name Orthopaedic 5 


Drug Name [Description | Dosage | Method of | Units Start Finish 
Number Admin per Day Date Date 


10225 Morphine -| Pain killer |10mg/ml Oral 50 | 24-Mar-14 24-Apr-14 

| 10334 | Tetracycline | Antibiotic |O.5mg/ml| V 10. | 24-Mar-14 | 17-Apr-14 | 

10223. | Morphine Fain killer | 10mg/ml Ora! 10 25-Apr-14 | 2-May-14 
药物 供应 


B-5 Wellmeadows 医院 病人 用 药 情 况 表 

医院 也 有 一 个 药品 供应 库 〈 例 如 ， 抗 生 素 、 止 痛 药 )。 药 品 供应 的 情况 包括 药品 号 和 名 
字 、 说 明 书 、 有 用量、 服用 方法 、 库 存 数量 、 再 订购 级 别 和 单价 。 药 品 号 可 以 唯一 标识 每 类 药 
品 。 每 个 病房 所 用 的 药品 都 会 得 到 控制 。 
病房 申请 表 

需要 时 ， 护 士 长 可 以 从 医院 的 中 心 库房 取 到 治疗 、 非 治疗 用 品 。 这 些 用 品 是 用 申请 表 按 
订货 的 顺序 供应 给 病房 的 。 申 请 表 的 信息 包括 唯一 的 申请 表 号 、 提 交 申 请 的 员工 名 字 、 病 房 
号 和 病房 名 字 。 它 也 包括 物品 或 药品 号 、 和 名字、 说明书、 用量、 服用 方法 (只 对 药品 )、 单 
价 、 所 需 数 量 和 订单 日 期 。 申 请 的 供应 品 被 送 到 病房 时 ， 申 请 表 由 护士 长 签名 并 标明 日 期 。 
Wellmeadows 医院 11 号 病房 用 于 订购 药品 的 申请 表 如 图 B-6 所 示 。 














Wellmeadows Hospital 
Central Store 
Requisition Form 


Requisition Number: 034567712 
Ward Number Ward 11 Requisitioned By Moira Samuel 


Ward Name Orthopaedic Requisition Date 15-Feb-i4 


Item/Drug Name Description | Dosage Method of | Cost per | Quantity 
Number (Drugs Only) | Admin Unit 





Received By: Date Received: 


图 B-6 Wellmeadows 医院 病房 申请 表 


供应 商 


治疗 、 非 治疗 用 品 供应 商 的 信息 也 需要 存储 ， 包 括 供应 商 的 名 字 和 编号 、 地 址 、 电 话 号 
码 和 传真 号 码 。 供 应 商 编号 能 唯一 标识 每 个 供应 商 。 


B.3.2 事务 需求 (示例 ) 


运行 下 列 事务 可 以 获得 适当 的 信息 ， 用 于 员工 管理 和 查看 Wellmeadows 医院 每 天 的 运 
营 情 况 。 每 项 事务 都 和 医院 特定 的 工作 联系 在 一 起 。 这 些 工 作 由 一 定 级 别 (位 置 ) 的 员工 负 
责 。 每 项 事务 的 主要 用 户 或 用 户 组 写 在 每 项 事务 描述 最 后 的 括号 里 。 

(a) 创建 和 维护 所 有 员工 情况 的 记录 (人事 部 主任 )。 

(b) 查找 具有 特殊 资格 证 或 有 一 定 工 作 经 验 的 员工 (人 事 部 主任 )。 

(c) 产生 一 个 报表 ， 列 出 分 配 到 每 个 病房 的 员工 的 情况 (人事 部 主任 和 护士 长 )。 

(d) 创建 和 维护 送 到 住院 部 的 病人 情况 的 记录 (所 有 员工 )。 

(e) 创建 和 维护 送 到 门诊 部 的 病人 情况 的 记录 (护士 长 )。 

(f) 产生 一 个 报表 ， 列 出 送 到 门诊 部 的 病人 的 情况 (护士 长 和 医务 主任 )。 

(g) 创建 和 维护 送 到 特定 病房 的 病人 情况 的 记录 (护士 长 )。 

(h) 产生 一 个 报表 ， 列 出 当前 在 特定 病房 的 病人 的 情况 (护士 长 和 医务 主任 )。 

(i) 产生 一 个 报表 ， 列 出 当前 在 等 待人 住 特定 病房 的 病人 的 情况 (护士 长 和 医务 主任 )。 

G) 创建 和 维护 给 特定 病人 所 开 药 方 情 况 的 记录 (护士 长 )。 

(k) 产生 一 个 报表 ， 列 出 特定 病人 的 药方 的 情况 (护士 长 )。 

(1) 创建 和 维护 医院 供应 者 情况 的 记录 (医务 主任 )。 

(m) 创建 和 维护 特定 病房 申请 供应 品 的 申请 表 细 节 的 记录 (护士 长 )。 

(n) 产生 一 个 报表 ， 列 出 对 具体 某 个 病房 提供 的 供应 品 的 情况 (护士 长 和 医务 主任 )。 
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可 选 的 ER 建 模 表示 法 





本 附录 目标 

本 附录 我 们 主要 学 习 : 

o 如 何 使 用 男 一 些 可 选 的 表示 法 来 创建 ER 模型 

在 第 12 章 和 第 13 章 中 学 习 了 如 何 使 用 越 来 越 流行 的 表示 法 一 一 UML (统一 建 模 语言 ) 
来 创建 (增强 的 ) 实体 联系 (ER) 模型 。 在 本 附录 中 ， 将 展示 男 外 两 套 常 用 的 ER 表示 法 。 第 
一 套 称 为 Chen( 陈 氏 ) 表示 法 ， 第 二 套 称 为 Crow Feet FUN) 表示 法 。 为 了 给 读者 提供 示范 ， 


下 面 列 出 两 个 表格 ， 展 示 ER 模型 中 每 个 基本 概念 所 对 应 的 表示 法 ， 然 后 再 通过 图 12-1 中 
的 一 部 分 ER 模型 范例 进一步 说 明 它 们 的 使 用 。 


C.1 使 用 Chen 表示 法 的 ER 建 模 


K C-1 列 出 了 与 ER 模型 中 主要 概念 所 对 应 的 Chen 表示 法 ,图 C-1 显示 了 将 图 12-1 中 
的 部 分 ER 模型 用 Chen 表示 法 重新 表现 出 来 的 结果 。 


表 C-1 用 于 ER 建 模 的 Chen 表示 法 








表 示 法 党 i 
实体 名 强 实体 
弱 实 体 
联系 名 联系 
与 弱 实 体 关 联 的 联系 


带 角色 名 的 递归 联系 ， 角 色 名 用 以 标识 实体 在 联系 中 所 扮演 的 角色 


属性 


主 关 键 字 属性 





多 值 属性 


(2%) 


mm 
ei An T OF 


C 属性 名 ， 派生 属性 


Si oy ee ee 
ee 


< > 一 _ 对 一 (1:1) 联系 
< > 一 对 多 (1:M) 联系 
<> 多 对 多 (M:N) 联系 


一 对 多 联系 ， 并 且 A AB 实体 都 强制 参与 此 联系 


ea 
< > | Bp | | 一 对 多 联系 ，B 实体 强制 参与 此 联系 ，A 实体 可 选 参与 此 联系 
a A. 


一 对 多 联系 ， 并 且 A ALB 实体 都 可 选 参与 此 联系 


概 化 /特殊 化 。 如 果 圆 圈 中 含 字 符 d (如 图 所 示 )， 则 联系 为 不 相交 ; 
如 果 圆 图 中 含 字 符 o， 则 联系 不 是 不 相交 的 。 从 超 类 到 圆圈 的 双 线 代 
表 强 制 参与 (如 图 所 示 ); 单线 则 代表 可 选 参与 





子 类 
. mgrStartDate © l 
- 1 1 
Supervisor hs i RA ieee i 
ag ot a eS eas 


Supervisee M -Sii 








| 
i 
| 


Ç steno > Client E te > 4 Preference 


图 C-1 将 图 12-1 所 示 ER 模型 中 的 一 部 分 用 Chen 表示 法 表示 


C.2 使 用 Crow Feet 表示 法 的 ER 建 模 


K C-2 列 出 了 与 ER 模型 中 主要 概念 所 对 应 的 Crow Feet 表示 法 ， 图 C-2 显示 了 将 图 12-1 
中 的 部 分 ER 模型 用 Crow Feet 表示 法 重新 表现 出 来 的 结果 。 
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表 C-2 用 于 ER 建 模 的 Crow Feet 表示 法 


表 示 法 = x 
实体 名 强 实体 
2 联系 
联系 名 
角色 名 ja 角色 名 带 角 色 名 的 递归 联系 ， 角 色 名 用 以 标识 实体 在 联系 中 所 扮演 的 
实体 名 人 


属性 在 实体 表示 的 下 半 部 分 
主 关 键 字 属 性 用 下 划 线 标 出 ， 多 值 属 性 放 在 花 括号 QP 中 


一 对 一 联系 

一 对 多 联系 

多 对 多 联系 

一 对 多 联系 ， IFA A AB 实体 都 强制 参与 此 联系 
一 对 多 联系 ，B 实体 强制 参与 此 联系 ，A 实体 可 选 参 与 此 联系 


一 对 多 联系 , 并且 A 和 B 实体 都 可 选 参与 此 联系 


H “EW” E “EE” BEARREN RRE 
















Supervisor 
: 


Registers 


/\\ 


clientNo 


图 C-2 将 图 12-1 所 示 ER 模型 中 的 一 部 分 用 Crow Feet 表示 法 表示 
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关系 数据 库 设 计 方 法 学 总 结 








pper EPI 
@ 数据 库 设 计 由 三 个 主要 的 阶段 组 成 : BA, PRPHMBREERI 
e 数据 库 设 计 方 法 学 各 主要 阶段 中 的 具体 步骤 


本 书 介绍 了 一 种 关系 数据 库 的 设计 方法 学 。 这 个 方法 由 三 个 主要 的 阶段 组 成 : Bia. 
辑 和 物理 数据 库 设 计 ， 这 些 都 已 经 在 第 16 ~ 19 章 详细 讨论 过 。 本 附录 将 为 那些 对 数据 库 设 
计 已 经 非常 熟悉 的 读者 简要 总 结 一 下 这 些 阶 段 中 的 各 个 步骤 。 


步骤 1 建立 概念 数据 模型 

概念 数据 库 设 计 的 第 一 步 就 是 针对 企业 的 数据 需求 设计 概念 数据 模型 。 概 念 数据 模型 包括 : 
实体 类 型 
联系 类 型 
属性 和 属性 的 域 
主 关 键 字 和 候选 关键 字 

e 完整 约束 条 件 

概念 数据 模型 有 支撑 文档 ， 包 括 数据 字典 ， 它 是 在 模型 开发 的 整个 过 程 中 逐步 产生 的 。 
我 们 将 随 着 本 步骤 各 项 任务 的 展开 逐步 细 化 支撑 文档 的 类 型 。 
步骤 1.1 标识 实体 类 型 

建立 局 部 概念 数据 模型 的 第 一 步 是 确定 用 户 感 兴趣 的 主要 对 象 。 标 识 实体 的 一 种 方法 是 
检查 用 户 需 求 说 明 书 ， 从 中 找 册 名词 和 名 词 短 语 。 也 可 以 通过 查找 主要 对 象 ， 比 如 人 、 地 点 
和 关注 的 概念 ， 排 除 那些 仅仅 作为 其 他 对 象 的 限定 词 的 名 词 。 用 文档 记录 实体 类 型 。 
步骤 1.2 标识 联系 类 型 

找 出 在 已 标识 的 实体 类 型 间 存 在 的 重要 联系 。 使 用 实体 联系 图 将 这 些 实体 和 联系 可 视 
化 。 确 定 联系 类 型 的 多 样 性 约束 。 检 查 可 能 存在 的 缺陷 。 用 文档 记录 联系 类 型 。 
步骤 1.3 标识 属性 并 将 属性 与 实体 或 联系 类 型 相关 联 

将 属性 关联 到 合适 的 实体 类 型 或 联系 类 型 上 。 确 定 属性 是 简单 属性 还 是 组 合 属 性 ， 是 单 
值 属性 还 是 多 值 属性 ， 是 否 导出 属性 等 。 用 文档 记录 属性 。 
步骤 1.4 确定 属性 域 

为 概念 模型 中 的 属性 确定 域 。 用 文档 记录 属性 域 。 
步骤 1.5 确定 候选 关键 字 、 主 关键 字 和 可 替换 关键 字 属 性 

为 每 个 实体 类 型 确定 候选 关键 字 ， 若 候选 关键 字 不 只 一 个 ， 则 选择 其 中 一 个 作为 主 关 键 
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字 。 用 文档 记录 每 一 个 强 实体 的 主 关键 字 和 候选 关键 字 。 
步 又 1.6 “考虑 使 用 增强 的 建 模 概念 可 选 步 又 ) 
考虑 使 用 增强 的 建 模 概念 ， 比 如 特殊 化 / 泛 化 、 聚 合 和 组 合 。 
步 又 1.7 检查 模型 的 元 余 
检查 模型 中 可 能 出 现 的 任何 宛 余 。 尤 其 是 重新 检查 一 对 一 联系 ， 去 除 宛 余 联 系 并 考虑 时 
间 维 度 。 
DIRLS ”针对 用 户 事务 验证 概念 数据 模型 
确保 概念 数据 模型 支持 所 要 求 的 事务 。 有 两 种 可 选 的 方法 : 氢 述 事务 或 使 用 事务 路 径 
走 查 。 
DYRIS 与 用 户 一 起 复查 概念 数据 模型 
与 用 户 一 起 复查 概念 数据 模型 以 确保 模型 真实 反映 了 企业 的 需求 。 


步骤 2 建立 逻辑 数据 模型 

根据 概念 数据 模型 构建 逻辑 数据 模型 ， 然 后 验证 该 模型 以 确保 其 结构 正确 (使 用 规范 化 
技术 )， 并 能 支持 所 要 求 的 事务 。 
步骤 2.1 从 逻辑 数据 模型 中 导出 关系 

根据 表示 已 标识 实体 、 联 系 和 属性 的 概念 数据 模型 创建 关系 。 表 D-1 总 结 了 如 何 将 实 
体 、 联 系 和 属性 映射 到 关系 中 。 用 文档 记录 关系 和 外 部 关键 字 属 性 ， 同 时 记录 那些 从 逻辑 数 
据 模 型 导出 关系 的 过 程 中 新 形成 的 主 关键 字 或 可 替换 关键 字 。 


表 D-1 如 何 将 实体 和 联系 映射 为 关系 


实体 / 联系 / 属性 映射 为 关系 
强 实体 生成 包含 所 有 属性 的 关系 
弱 实体 生成 包含 所 有 简单 属性 的 关系 ( 当 与 每 个 属 主 实体 的 联系 被 映射 之 后 ， 再 标识 
出 主 关 键 字 ) 
_ 对 多 一 元 联系 一 方 实体 的 主 关键 字 作 为 表示 多 方 实体 的 关系 的 外 部 关键 字 ， 该 联系 若 有 任 
2 k 何 属 性 也 安排 在 多 方 

一 对 二 二 元 联系 

(a) 两 方 都 强制 参与 两 个 实体 组 合 为 一 个 关系 

(b) 一 方 强制 参与 可 选 方 实体 的 主 关 键 字 安排 为 表示 强制 方 实体 的 关系 的 外 部 关键 字 

(c) 两 方 都 可 选 参与 若 没有 进一步 的 信息 则 可 随意 
HX / 子 类 联系 参见 表 D-2 


生成 一 个 表示 该 联系 的 关系 ， 该 关系 包含 该 联系 的 所 有 属性 作 ， 为 该 关系 外 
部 关键 字 出 现 的 所 有 属 主 实体 的 主 关键 字 


多 值 属 性 生成 一 个 表示 该 属性 的 关系 ， 并 把 该 属性 的 属 主 实体 的 主 关键 字 作为 该 关系 
的 外 部 关键 子 


多 对 多 二 元 联系 ， 复 杂 联 系 


表 D-2 ”基于 参与 和 不 相交 约束 的 超 类 / 子 类 联系 的 表示 


参与 约束 不 相交 约束 映射 为 关系 


强制 非 不 相交 {And} 单个 关系 (用 一 个 或 多 个 判别 式 区 分 每 个 元 组 的 类 型 ) 


(2%) 
参与 约束 不 相交 约束 映射 为 关系 


K 
i 两 个 关系 : 一 个 表示 超 类 ， 另 一 个 表示 所 有 子 类 (用 一 个 或 多 个 判别 式 
可 选 非 不 相交 {And} “| 区 分 每 个 元 组 的 类 型 ) 


强制 不 相交 {Or} 多 个 关系 : 每 一 对 超 类 / 子 类 转化 为 一 个 关系 
可 选 不 相交 {Or} 多 个 关系 : 一 个 关系 表示 超 类 ， 其 他 每 个 子 类 对 应 一 个 关系 


步骤 2.2 使 用 规范 化 方法 验证 关系 

使 用 规范 化 方法 验证 逻辑 数据 模型 中 的 关系 。 这 个 步骤 的 目标 是 确保 从 逻辑 数据 模型 中 
导出 的 每 个 关系 至 少 是 第 三 范式 ( 3NF)。 
步骤 2.3 针对 用 户 事务 验证 关系 

保证 逻辑 数据 模型 中 的 关系 支持 所 要 求 的 事务 。 
PUR 2.4 检查 完整 约束 条 件 

确定 完整 性 约束 条 件 ， 包 括 指 定 有 效 数据 约束 、 属 性 域 约束 、 多 样 性 、 实 体 完整 性 、 引 
用 完整 性 、 一 般 性 约束 。 用 文档 记录 所 有 的 完整 性 约束 。 
步骤 2.$ 与 用 户 一 起 复查 逻辑 数据 模型 

保证 用 户 肯 定 该 逻辑 数据 模型 真实 反映 了 企业 的 数据 需求 。 
步骤 2.6 ”将 多 辑 数据 模型 合并 为 全 局 模型 

方法 学 中 步骤 2 的 指南 适用 于 从 简单 到 复杂 数据 库 的 设计 。 例 如 ， 无 论 设 计 单 用 户 或 多 
用 户 视 图 的 数据 库 ， 若 采用 集中 法 (参见 10.5 节 )， 则 步骤 2.6 可 省 去 。 然 而 ， 当 数据 库 有 
多 个 视图 ， 系 统 选择 采用 视图 集成 法 (参见 10.5 节 ) 设计 时 ， 那 么 对 代表 数据 库 不 同 视图 的 
每 个 模型 都 要 重复 步骤 2.1 至 步骤 2.5， 在 步骤 2.6 合并 这 些 数据 模型 。 合 并 过 程 中 通常 的 任 
务 包括 : 

(1) 检查 实体 /关系 的 名 字 与 内 容 以 及 它们 的 候选 关键 字 。 

(2 ) 检查 联系 /外 部 关键 字 的 名 字 与 内 容 。 

(3 ) 合并 来 自 局 部 数据 模型 中 的 实体 /关系 。 

(4) 纳入 (不 是 合并 ) 那些 仅 出 现在 某 个 局 部 数据 模型 的 实体 /关系 。 

(5 ) 合并 来 自 局 部 数据 模型 中 的 联系 / 外 部 关键 字 。 

(6) 纳入 (不 是 合并 ) 那些 仅 出 现在 某 个 局 部 数据 模型 的 联系 / 外 部 关键 字 。 

(7) 检查 是 否 有 遗漏 的 实体 /关系 和 联系 / 外 部 关键 字 。 

(8 ) 检查 外 部 关键 字 。 

(9) 检查 完整 性 约束 。 

(10) 绘制 全 局 ER/ 关系 图 。 

(11 ) 更 新 文档 。 如 果 必 要 的 话 ， 使 用 规范 化 技术 来 验证 由 全 局 逻辑 数据 模型 创建 的 关 

系 ， 保 证 它们 支持 所 需 的 事务 。 

步骤 2.7 检查 模型 对 未 来 可 扩展 性 的 支持 


判断 在 可 预见 的 将 来 是 否 会 出 现 一 些 重 大 变化 ， 并 评估 全 局 逻辑 数据 模型 是 否 能 适应 这 
些 变 化 。 
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步骤 3 ”转换 逻辑 数据 模型 以 适应 目标 DBMS 
由 逻辑 数据 模型 产生 一 个 可 在 目标 DBMS 中 实现 的 关系 数据 库 模式 。 
步骤 3.1 设计 基础 关系 


确定 在 目标 DBMS 中 如 何 表示 全 局 逻辑 数据 模型 中 的 各 个 基本 关系 。 用 文档 记录 这 些 
基本 关系 的 设计 。 


步骤 3.2 设计 导出 数据 的 表示 方法 
确定 在 目标 DBMS 中 如 何 表示 全 局 逻辑 数据 模型 中 存在 的 导出 数据 。 用 文档 记录 这 些 
导出 数据 的 设计 。 


步骤 3.3 设计 一 般 性 约束 
针对 目标 DBMS 设计 一 般 性 约束 。 用 文档 记录 一 般 性 约束 的 设计 。 


步骤 4 ”设计 文件 组 织 方法 和 索引 

选择 可 选 的 文件 组 织 方法 ， 用 以 存储 基本 关系 和 索引 以 使 其 达到 可 接受 的 性 能 ， 也 就 是 
确定 关系 和 元 组 在 辅 存储 器 上 存储 的 方式 。 
步骤 4.1 “分析 事务 

理解 那些 将 要 在 数据 库 上 运行 的 事务 并 分 析 重 要 的 事务 。 
35K 4.2 ”选择 文件 组 织 方法 

为 每 个 基本 关系 确定 有 效 的 文件 组 织 方法 。 
步骤 4.3 ”选择 索引 

确定 增加 的 索引 是 否 改善 了 系统 的 性 能 。 
步骤 4.4 ”估计 所 需 的 磁盘 空间 

估计 数据 库 所 需要 的 磁盘 空间 量 。 


步骤 5 设计 用 户 视 图 

设计 那些 早 在 关系 数据 库 系统 开发 生命 周期 的 需求 收集 和 分 析 阶 段 就 已 经 确定 的 用 户 视 
图 。 用 文档 记录 这 些 用 户 视图 的 设计 。 
GRE 设计 安全 机 制 

根据 用 户 要 求 设计 数据 库 的 安全 措施 。 用 文档 记录 这 些 安全 措施 的 设计 。 
步骤 7 ”考虑 引入 可 控 元 余 

确定 是 否 需要 以 可 控 的 方式 引入 元 余 ， 绥 解 规范 化 限制 以 提高 系统 的 性 能 。 例 如 ， 考 虑 
复制 属性 或 将 关系 连接 起 来 ， 等 等 。 用 文档 记录 引入 的 元 余 。 
PRS 监控 系统 和 系统 调 优 

监控 实际 运行 系统 ， 为 了 纠正 不 合理 的 设计 决策 或 适应 变更 的 需求 ， 调 优 系统 性 能 。 


附录 EE | 


Database Systems: A Practical Approach to Design, Implementation, and Management, 6E 


轻 量 级 RDBMS: Pyrrho 简介 





Malcolm Crowe #43, www.pyrrhodb.com 


jo val m mT ny A 
t ai 


本 附录 我 们 主要 学 习 : 
e Pyrrho DBMS 的 主要 概念 和 体系 结构 
è Pyrrho 与 SQL:2011 标准 的 兼容 性 
e 用 户 和 开发 人 员 如 何 使 用 Pyrrho DBMS 


Pyrrho 是 一 个 小 规模 的 开源 关系 数据 库 (小 于 1MB)， 特 别 适合 移动 和 骨 入 式 应 用 。 它 
在 所 提供 的 特性 上 与 SQL:2011 标准 严格 兼容 。Pyrrho 能 运行 在 Windows 的 .NET 平台 和 
Linux 上 ， 除 了 通常 的 .NET 类 (IDbCommand、DataReader 和 DataAdapter 等 ) 外 ， 它 还 能 
与 PHP 和 SWIProlog 接口 。 开 源 Pyrrho 也 实现 了 Java 持久 API。 对 于 这 些 特 性 ，Pyrrho 做 
了 两 点 扩充 : 一 是 增加 了 遵循 OWL2 的 语义 数据 和 行 类 型 ， 二 是 支持 基于 角色 的 安全 和 数 
据 建 模 ， 即 数据 库 对 象 的 命名 和 操作 许可 均 依赖 于 用 户 当 前 的 角色 。 

Pyrrho 采用 严格 的 ACID 事务 模型 : Pyrrho 事务 完全 隔离 (无 污 读 ) 且 强 势 持 久 ， 即 数 
据 库 历史 完全 保留 且 不 能 更 改 ， 除 非 破坏 数据 库 本 身 。 原 子 性 和 一 致 性 如 此 来 强制 : 用 单一 
操作 将 事务 的 所 有 数据 写 到 非 易 失 存 储 器 ， 这 意味 着 Pyrrho 写 人 非 易 失 存 储 器 的 次 数 约 为 
其 他 DBMS 的 1/70. Ak, AIRS aA RBM A, Pyrrho 将 更 快 ， 更 适合 远程 存储 ( 例 
如 移动 装置 )。 

关于 用 户 身 份 标识 和 操作 许可 ，Pyrrho 也 采取 严格 的 观点 ，Pyrrho 应 该 用 于 那些 数据 
稳定 聚集 并 要 永久 保持 的 应 用 场景 。 例 如 ， 客 户 数据 、 订 单 记 录 和 付款 记录 等 。 而 一 些 过 
程 性 数据 ， 如 分 析 、 预 测 等 数据 也 能 用 Pyrrho 处 理 ， 但 应 放 在 另外 的 数据 库 ， 与 永久 数据 
分 离开 来 。 这 样 一 来 ， 这 些 过 程 性 数据 产生 的 结果 一 旦 用 完 ， 过程 性 数据 就 可 以 整体 删 掉 。 
Pyrrho 对 多 数据 库 连 接 的 文 持 也 使 得 这 样 做 成 为 可 能 。 

本 附录 总 结 了 Pyrrho 的 基本 特性 。Pyrrho 的 各 个 版 本 ( 1-6MB) 都 可 从 Pyrrho Web 网 
站 www.pyrrhodb.com 上 免费 下 载 ， 网 站 上 还 有 访问 Pyrrho SQL 语法 和 其 他 特性 的 细节 信息 
的 链接 。 


E.1 Pyrrho 特性 


Pyrrho 包括 下 列 主要 的 SQL:2011 特性 : SQL 例 程 语言 ; 间隔 (intervals) 和 日 期 时 间 
(datetime) 型 数据 计算 ; 含 子 查询 的 域 和 约束 ; 计算 完备 性 ; 导出 表 ; 行 和 表 构 造 器 ; 结 
构 类 型 ; 数组 ; 多 重 集 ; 角色 ; AA OLAP 功能 ; 时 序 版 本 化 表 和 XML。 完 整 特性 列表 见 
Web 网 站 。 

Pyrrho 在 以 下 方面 与 SQL:2011 标准 不 同 : 认为 小 整 型 (smallint) 和 双 精 度 是 多 余 的 ， 因 
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MATA (HRN int 和 实 型 real RE); 无 限制 变 长 串 ( unbounded varying strings) 
被 视 为 默认 类 型 ; 在 SQL 中 可 用 HTTP 操作 ; REVOKE 比 在 SQL:2011 中 更 直观 (无 条 件 收 
回 权 限 ); ISOLATED (隔离 ) 是 唯一 能 进行 的 事务 设置 ; 文 持 时 序 表 ; ALTER SCHEMA 基 
于 角色 并 包括 某 些 元 数据 和 级 联 的 重 命名 ; 不 支持 CREATE SCHEMA 和 老式 的 能 入 式 SQL 
结构 。 此 外 : 

e Pyrrho 文 持 完整 Unicode 字符 集 ， 并 且 数 据 库 是 场地 独立 的 。 

e 开源 版 本 支持 Java 永久 库 。 

e 所 有 版 本 都 支持 PHP、SWI-Prolog 和 LINQ。 


E.2 下 载 并 安装 Pyrrho 

在 Windows 下 首先 要 安装 .NET 平台， 从 Microsoft Update 可 获得 。 在 Linux F, Mono 
project (www.monoproject.com) 提供 所 要 求 的 下 载 。 

从 www.pyrrhodb.com 下 载 Pyrrho 专业 版 并 在 合适 的 目录 位 置 抽取 出 文件 。 一 种 好 的 习 
惯 是 把 服务 器 PyrrhoSvr.exe 移动 到 男 一 目录 位 置 ， 包 含 PyrrhoSvr.exe 的 文件 夹 也 将 包含 数 
据 库 文件 ， 因 此 ， 该 文件 夹 的 所 有 者 应 从 命令 行 启动 PyrrhoSvr.exe。 在 Linux 下 ， 该 命令 为 
mono PyrrhoSvr.exe. 

为 预防 起 见 ，Windows 可 能 会 提示 中 止 了 该 程序 ， 如 果 你 想 继续 在 网 络 上 用 该 服务 
怖 ， 则 按 一 下 该 安全 对 话 框 中 的 “不 中 止 ”按钮 。 关 于 防火 墙 配置 细节 ， 见 Web 网 站 www. 
pyrrhodb.com, 

默认 情况 下 ，PyrrhoSvr 在 端口 5433 提供 数据 库 服务 ， 在 端口 8080 提供 Web 服务 。 可 
用 你 的 Web 浏览 器 http://localhost:8080/ 检查 一 下 该 服务 器 是 否 正在 运行 。 

导出 的 Web 页 可 用 于 试用 简单 的 SQL 语句 。 

下 载 中 有 两 个 标准 实用 程序 ， 一 个 是 PyrrhoCmd， 它 是 带 控 制 台 界 面 的 命令 行 处 理 器 ; 
另 一 个 是 PyrrhoSQL ， 它 用 的 是 Windows 用 户 界 面 。 客 户 端 若 要 连接 一 个 Pyrrho 或 开源 
Pyrrho 数据 库 ， 必 须要 有 客户 端 库 PyrrhoLink.dll (或 OSPLink.dll1)。 最 简单 的 做 法 就 是 将 

一 个 PyrrhoLink.dll/OPSLink.dll 的 副本 放 在 DRATT ARNE (4% Visual Studio 这 
类 工具 会 自动 完成 )。 

对 于 磐 入 式 应 用 ， 这 个 动态 链接 库 (.dll) 常 与 EmbeddedPyrrho.dll、OSP.dll、Android- 

OSP.dll、PhoneOSP.dll SilverlightOSP.dll 中 的 某 个 连用 。 


E.3 开始 使 用 


为 了 从 命令 令 行 开始 使 用 数据 库 ， 键入 : 

PyrrhoCmd 

默认 的 数据 库 名 为 Temp ， 知 要 用 一 个 别 的 数据 库 ， 则 可 在 该 命令 行 后 面 指出 来 。 上 面 
的 命令 行 第 一 次 运行 时 ，PyrrhoSvr 会 创建 一 个 称 为 Temp 的 数据 库 ， 新 数据 库 的 所 有 者 就 是 
发 出 这 条 PyrrhoCmd 命令 的 用 户 。 计 算 机 显示 光标 SQL> 作为 回应 。 系 统 表 Sys$Database 
和 Sys$Table 可 用 于 检查 哪些 表 可 访问 : 

SQL> TABLE “Sys$Database” 


HER, SQL:2003 要 求 用 双 引 号 ， 把 那些 匹配 保留 字 、 大 小 写 敏 感 或 包含 $ 这 样 的 特殊 
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字符 的 标识 符 括 起 来 。 
用 这 样 的 语句 创建 表 : 
CREATE TABLE Members (id int primary key, surname char) 


这 将 创建 一 个 名 为 MEMBERS 的 表 。 注 意 Pyrrho 默认 域 的 大 小 ， 因 此 这 里 的 SURNAME 
实际 是 个 串 。 为 了 在 MEMBERS 中 加 入 行 ， 可 用 语句 : 
INSERT INTO Members (surname) values (‘Bloggs’), (‘Smith’) 


SAHT, Pyrrho 会 为 整形 int 的 主 关 键 字 提供 合适 的 值 ， 比 如 这 里 的 ID ， 当 然 你 也 可 以 
自己 提供 值 。 

用 这 样 的 命令 行 界 面 输入 SQL 语句 时 ， 要 避免 在 语句 结束 前 使 用 回 车 键 。 一 种 可 选 的 
办 法 是 ,语句 前 级 上 [ 并 以 ] 结束 ， 此 时 在 语句 中 间 即 可 用 回 车 键 了 。 


E.4 连接 串 


应 用 开发 人 员 可 用 .NET API 进行 数据 库 系统 开发 。 为 了 用 PyrrhoLink.dll 连接 数据 库 ， 
要 先 定义 PyrrhoConnect 的 一 个 实例 。 用 C 写 的 代码 为 : 


var conn = new PyrrhoConnect(connectionString); 
conn.Open(); 


为 连接 名 为 Temp.pfl HAPAG, PERE AT eA “Files=Temp” - 

连接 一 旦 打开 ， 标 准 的 NET 机 制 便 开 始 作 用 。 首 先 ， 使 用 CreateCommand 方法 创建 
一 个 IDbCommand， 利 用 CommandText 属性 即 可 将 一 个 SQL 语句 赋 给 它 。 然 后 ， 该 命令 
调用 ExecuteNonQuery， 将 SQL 语句 送 到 服务 器 执行 ， 接 者 调用 ExecuteReader 给 出 一 个 
DataReader， 用 于 读 取 和 访问 所 选 数据 。 

使 用 Visual Studio 的 开发 者 还 能 增加 来 自 PyrrhoLink.dll 的 一 些 工具 箱 条 目 ， 包 括 内 含 
连接 串 设 计 器 的 数据 适配器 等 。 


E.5 Pyrrho 的 安全 模型 


最 时 使 用 客户 端 实用 程序 的 某 个 人 应 该 创建 数据 库 的 基本 表 ， 并 把 对 这 些 表 的 操作 许可 
授予 其 他 用 户 。 对 于 每 个 事务 ，Pyrrho 都 记录 下 用 户 和 他 在 此 事务 中 的 角色 。 每 个 数据 库 都 
有 一 个 与 数据 库 同名 的 缺 省 角色 ， 数 据 库 最 初 的 创建 者 可 以 使 用 该 角色 名 。 一 个 用 户 可 能 被 
授予 几 种 角色 权限 ， 但 一 次 只 能 用 一 种 ， 或 在 连接 串 中 选 定 ， 或 用 SET ROLE 命令 交互 式 
设置 ， 例 如 ， 


set role “Sales” 


其 他 用 户 必 须 在 授予 某 种 具体 权限 〈 使 其 在 数据 库 中 具有 合法 身份 ) 后 才能 对 数据 库 进 
行 任何 修改 。 

共享 数据 库 最 简单 (也 是 最 坏 ) 的 方式 就 是 允许 所 有 具有 这 样 的 角色 名 的 用 户 做 任何 事 ， 
而 匿名 用 户 只 允许 读 操 作 。 因 此 ， 在 Windows 下 ， 如 果 数 据 库 MyDb 上 没有 其 他 安全 设置 ， 
那么 该 数据 库 的 创建 者 就 能 利用 下 面 的 授权 语句 与 计算 机 (或 域 ) JOE 上 的 用 户 “ mary” 共 
享 该 数据 库 ; 

GRANT ROLE “MyDb” to “JOE\mary” 
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这 将 允许 “mary” 以 任何 方式 访问 或 修改 该 数据 库 ， 除 了 不 能 改 安全 设置 。 双 引号 是 
必需 的 ， 因 为 数据 库 名 和 用 户 名 都 是 大 小 写 敏 感 的 。 而 语句 
GRANT ROLE MyDb to public 


则 使 得 任何 用 户 都 能 访问 和 修改 数据 库 MyDb ， 但 不 能 改 安全 设置 。 其 他 形式 的 授权 语 
句 可 用 于 说 明 对 特定 的 数据 库 对 象 可 使 用 哪些 特殊 权利 。 授 权 可 用 REVOKE 语句 撤销 。 当 
用 户 被 授予 操作 许可 后 ， 他 们 当然 就 能 访问 由 这 些许 可 确定 的 当前 可 访问 的 数据 。 也 有 一 些 
特例 : 比如 数据 库 的 所 有 者 能 访问 所 有 日 志 ， 系 统 表 是 对 所 有 用 户 公 开 但 是 只 读 的 。 

注意 ，Pyrrho 的 用 户 ID 就 是 用 户 名 (在 Windows 下 形式 为 “DOMAINNuser”)， 而 不 
是 操作 系统 使 用 的 UID 或 SID。 


E.6 Pyrrho SQL 语法 


Pyrrho 中 的 串 用 单 引 号 括 起 来 。 串 中 连续 的 两 个 单 引 号 则 表示 一 个 单 引 号 。Hexits 是 
六 进 制 数字 0-9, A-F 和 a-f， 它 们 用 于 表示 二 进 制 对 象 。 日 期 、 时 间 和 间隔 都 用 (引起 来 ) 
串 值 ， 并 且 不 是 场地 依赖 的 。 更 多 细节 见 SQL:2003。 例 如 ， 
日 期 数据 形式 如 DATE“yyyy-mm-dd . 
时 间 数 据 形 式 如 TIME“hh:mm:ss” #% TIME ‘hh:mm:ss.sss’ o 
时 间 惟 形式 如 TIMESTAMP ‘yyyy-mm-dd hh:mm:ss.ss’ o 
间 隅 的 形式 包括 : 
= INTERVAL ‘yyy’ YEAR 
= INTERVAL ‘yy-mm’ YEAR TO MONTH 
m INTERVAL ‘m’ MONTH 
= INTERVAL ‘d hh:mm:ss” DAY(1) TO SECOND 
= INTERVAL ‘sss.ss’ SECOND(3, 2) 等 
下 面 列 出 Pyrrho 支持 的 SQL 文法 大 纲 ， 更 多 细节 可 下 载 文档 Pyrrho.doc， 或 在 Web 网 
站 上 查看 。 


Sql = SqlStatement [; ] . 


SqlStatement = Alter 
| BEGIN TRANSACTION [WITH PROVENANCE string ] 
| Call 
| COMMIT 
| CreateClause 
| CursorSpecification 
| DeleteSearched 
| DropClause 
| Grant 
| Insert 
| Rename 
| Revoke 
| ROLLBACK 
| SET AUTHORIZATION ‘=’ CURATED 
| SET PROFILING ‘=’ (ON | OFF) 
| SET ROLE id 
| SET TIMEOUT ‘=’ int 
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Statement = 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 


HttpRest = 
| 


Alter = 


Method = 


UpdateSearched 
HTTP HttpRest . 


Assignment 

Call 
CaseStatement 
Close 
CompoundStatement 
BREAK 
Declaration 
DeletePositioned 
DeleteSearched 
Fetch 
ForStatement 
IfStatement 
Insert 

ITERATE label 
LEAVE label 
LoopStatement 
Open 

Repeat 

RETURN Value 
SelectSingle 
SIGNAL Condition_id 
UpdatePositioned 
UpdateSearched 
While 

HTTP HttpRest. 


(ADD| UPDATE) url_Value data_Value [AS mime_string] 
DELETE wr! Value. 


ALTER DOMAIN id AlterDomain { ‘,’ AlterDomain } 
ALTER FUNCTION id ‘(° Parameters ‘)’ RETURNS Type 
AlterBody 

ALTER PROCEDURE id ‘( Parameters ') AlterBody 
ALTER Method AlterBody 

ALTER TABLE id AlterTable { ‘,’ AlterTable } 

ALTER TYPE id AlterType { ‘,’ AlterType } 

ALTER VIEW id AlterView { ‘,’ AlterView }. 


MethodType METHOD id ‘(‘ Parameters‘) [RETURNS Type] 
[FOR id]. 


Parameters = Parameter {‘,’ Parameter } . 


Parameter = id Type . 


MethodType = 


AlterDomain = 


AlterBody = 


AlterOp = 
| 


[OVERRIDING | INSTANCE | STATIC | CONSTRUCTOR]. 


SET DEFAULT Default 
DROP DEFAULT 
TYPE Type 

AlterCheck . 


AlterOp { ‘,’ AlterOp } . 


TO id 
Statement 
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| [ADD| DROP] Metadata . 


Default = Literal | DateTimeFunction | CURRENT_USER | 
CURRENT ROLE | NULL | ARRAY’(‘’Y | MULTISET’(’)’ . 
AlterCheck = ADD CheckConstraint 


| [ADD] DROP] Metadata 
| DROP CONSTRAINT id . 


CheckConstraint = [CONSTRAINT id] CHECK ‘(‘[XMLOption] 
SearchCondition ‘Y. 


XMLOption = WITH XMLNAMESPACES ‘( XMLNDec {‘, XMLNDec } ‘)’ . 
XMLNDec = (string AS id) | (DEFAULT string) | (NO DEFAULT) . 


下 列 标准 名 空间 和 前 级 为 预定 义 的 : 


hitp://www.w3.org/1999/02/22-rdf-syntax-ns#’ AS rdf 
http://www.w3.org/2000/01/rdf-schema#’ AS rdfs 
hitp://www.w3.org/2001/XMLSchema#’ AS xsd 
hitp://www.w3.org/2002/07/owl#’ AS owl 


AlterTable = TO id 
| ADD ColumnDefinition 
| ALTER [COLUMN] id AlterColumn { *,’ AlterColumn } 
| DROP [COLUMN] id DropAction 
| (ADD| DROP) (TableConstraintDef | VersioningClause) 
| ADD TablePeriodDefinition [AddPeriodColumn List] 
| AlterCheck 
| [ADD | DROP] Metadata . 


AlterColumn = TO id 

| POSITION int 

| (SET | DROP) ColumnConstraint 
| AlterDomain 

| GenerationRule 

| 


Metadata. 


e= TO id 

| ADD ( Member | Method ) 

| DROP ( Member_id | Routine) 

| Representation 

| Metadata 

| ALTER Member id AlterMember { ', AlterMember } . 


Member = id Type [DEFAULT Value] Collate . 
AlterMember = TO id 


| Metadata 
| TYPE Type 
| SET DEFAULT Value 
| DROP DEFAULT . 
AlterView = SET (INSERT | UPDATE|DELETE|) TO SqlStatement 
| SET SOURCE TO QueryExpression 
| TO id 
| Metadata . 
Metadata = ATTRIBUTE | CAPTION | ENTITY | HISTOGRAM | 


LINE | POINTS | PIE | SERIES | X | Y | string | iri. 
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标志 和 “约束 ” 串 都 是 Pyrrho 的 表达 式 。 实 体 和 属性 影响 XML 的 输出 ， 而 其 他 标志 


影响 HTML 的 输出 。 串 是 在 角色 中 的 对 象 文档 。 


AddPeriodColumnList = ADD [COLUMN] Start_ColumnDefinition ADD 
[COLUMN] End_ColumnDefinition . 


CreateClause = CREATE ROLE id [Description_string] 
| CREATE DOMAIN id [AS] DomainDefinition 


| CREATE FUNCTION id ( Parameters ‘ RETURNS Type 


Statement 


| CREATE ORDERING FOR UDType_id (EQUALS ONLY| 


ORDER FULL) BY Ordering 

| CREATE PROCEDURE id ‘(‘ Parameters ‘)’ Statement 

| CREATE Method Body 

| CREATE TABLE id TableContents [UriType] {Metadata} 

| CREATE TEMPORAL VIEW id AS [TABLE] id WITH 
KEY Cols 

| CREATE TRIGGER id (BEFORE|AFTER) Event ON id 
[ RefObj ] Trigger 

| CREATE TYPE id [UNDER id] [Representation] [ Method 
{‘,” Method} ] 

i, CREATE ViewDefinition 


| CREATE XMLNAMESPACES XMLNDec {', XMLNDec }. 


Representation = (StandardType|Table_id|’(‘ Member {', Member }’)’) 
[UriType] {CheckConstraint} . 


UriType = [Abbrev_id]’* “’( [Namespace_id] ‘:’ id | uri ) . 


UriType 的 语法 属 Pyrrho WH FE. Abbrev id 仅 能 通过 一 个 CREATE DOMAIN 语句 提 


BM, 7.2.2 节 。 


DomainDefinition = StandardType [UriType] [DEFAULT Default] 
{ CheckConstraint } Collate . 
Ordering = (RELATIVE|MAP) WITH Routine 
| STATE . 


TableContents = ‘(‘ TableClause {‘,’ TableClause } ‘)’ { VerisoningClause } 
| OF Type_id [‘(‘ TypedTableElement {*,’ TypedTableElement} ‘)’] 
| AS Subquery . 
VersioningClause = WITH (SYSTEM|APPLICATION) VERSIONING . 
WITH APPLICATION VERSIONING 是 Pyrrho 专 有 的 。 


TableClause = ColumnDefinition {Metadata} | TableConstraint | 
TablePeriodDefinition . 


ColumnDefinition = id Type [DEFAULT Default] {ColumnConstraint | Check 
Constraint} Collate 
| id GenerationRule 
| id Table_id ‘.’ Column_id. 


最 后 一 种 形式 是 查看 表 的 简化 版 ， 例 如 ab HIX int, IA a.b 就 是 int check (value in 


(select b from a)) 的 缩写 。 
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GenerationRule = GENERATED ALWAYS AS ‘(‘Value’)’ [UPDATE ‘(‘ 
Assignments ) ] 
| GENERATED ALWAYS AS ROW (START |NEXT|END). 


此 句 中 第 一 行 可 选 的 更 新 子 句 是 Pyrrho 的 创新 。 第 二 行 是 SQL:2011 新 引入 的 ， 表 示 一 
个 新 行 的 开始 时 间 起 初 是 当前 时 间 ， 交 付 时 改 为 系统 (事务 ) 时 间 。NEXT 是 Pyrrho 为 时 序 
表 新 增加 的 ， 它 为 动态 的 ， 受 其 他 行 变 动 的 影响 。 


ColumnConstraint = [CONSTRAINT id ] ColumnConstraintDef . 


ColumnConstraintDef = NOT NULL 
| PRIMARY KEY 
| REFERENCES id [ Cols ] [USING Values] { ReferentialAction } 
| UNIQUE . 


TableConstraint = [ CONSTRAINT id ] TableConstraintDef . 


TableConstraintDef= UNIQUE Cols 
| PRIMARY KEY Cols 
| FOREIGN KEY Cols REFERENCES Table_id [ Cols ] 
{ ReferentialAction }. 


TablePeriodDefinition= PERIOD FOR PeriodName ‘(‘ Colwmn_id *,’ Column_id ‘Y. 
PeriodName = SYSTEM_TIME | id. 
TypedTableElement = ColumnOptionsPart | TableCnstraint . 


ColumnOptionsPart = id WITH OPTIONS ‘( ColumnOption {°,’ 
ColumnOption } ‘Y. 


ColumnOption = (SCOPE Table_id) | (DEFAULT Value) | ColumnConstraint. 
Values = ‘(t Value {‘,’ Value } ‘Y. 
Cols = ‘(id { ‘, id } ‘Y | ‘( POSITION ‘Y. 
ReferentialAction = ON (DELETE | UPDATE) (CASCADE| SET 
DEFAULT | RESTRICT). 


ViewDefinition = VIEW id AS QueryExpression [UPDATE SqlStatement] 
[INSERT SqlStatement] [DELETE SqlStatement] {Metadata}. 


这 是 对 SQL:2011 语法 的 扩充 ， 目 的 是 提供 访问 间接 表 更 简单 的 机 制 。 所 有 这 些 都 能 用 
Web 服务 访问 远程 数据 。 


Event = INSERT | DELETE | (UPDATE [ OF id { ‘, id } ]). 
RefObj = REFERENCING { (OLD|NEW)[ROW|TABLE][AS] id } . 


Trigger = FOR EACH ROW [ TriggerCond ] (Call | (BEGIN ATOMIC 
Statements END)) . 


TriggerCond = WHEN ‘(° SearchCondition ‘Y . 
DropClause = DROP DropObject DropAction . 
DropObject = ROLE id 
| TRIGGER id 
ORDERING FOR id 


| 
| ObjectName 
| XMLNAMESPACES (id| DEFAULT) {‘,’ (id| DEFAULT) } . 
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DropAction = | RESTRICT | CASCADE . 
Rename = SET ObjectName TO id . 


Grant = GRANT Privileges TO GranteeList [ WITH GRANT OPTION | 
| GRANT Role id { ‘,’ Role_id } TO GranteeList [ WITH 
ADMIN OPTION ] . 


Revoke = REVOKE [GRANT OPTION FOR] Privileges FROM 

Grantee List 
| REVOKE [ADMIN OPTION FOR] Role id { ‘,’ Role_id } 

FROM GranteeList . 

Privileges = ObjectPrivileges ON ObjectName. 

ObjectPrivileges = ALL PRIVILEGES | Action { ', Action } . 

Action = SELECT LC id { ‘,’ id } *)’ ] 

| DELETE 

| INSERT [ ‘(id { ‘,’ id } Y] 

| UPDATE [ ‘(id {id} Y] 

| REFERENCES [ ‘(‘ id { *,’ id } ‘)’ J 

| USAGE 

| TRIGGER 

| EXECUTE 

| OWNER . 


ObjectName = TABLE id 
| DOMAIN id 
| TYPE id 
| Routine 
| VIEW id 
| DATABASE. 


GranteeList = PUBLIC | Grantee { ‘,’ Grantee } . 


Grantee = [USER] id 
| ROLE id . 
关于 在 Pyrrho 中 角色 的 使 用 参见 7.6 节 。 
Routine = PROCEDURE id [‘(‘Type, {‘,’ Type }’)’] 


| FUNCTION id [‘(‘Type, {', Type }’)’] 
[MethodType] METHOD id [‘(‘Type, {, Type }’)’] [FOR id | 
| TRIGGER id. 


Type = (StandardType | Defined Type | Domain_id | Type_id)[UriType]. 


StandardType = BooleanType | CharacterType | FloatType | IntegerType | 
LobType | NumericType | DateTimeType | IntervalType | 
XML Type . 


BooleanType = BOOLEAN. 


CharacterType = (([ NATIONAL] CHARACTER) | CHAR | NCHAR | VARCHAR) 
[VARYING] [ (mt ‘)’] [CHARACTER SET id ] Collate . 


Collate = [COLLATE id]. 
LobType = BLOB | CLOB | NCLOB. 


NCHAR 默默 地 改 为 CHAR，NCLOB MAH CLOB. COLLATE UNICODE 是 默认 的 。 
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FloatType = | (FLOAT REAL) [‘(‘int’,'int’)’] . 

IntegerType = INT | INTEGER. 

Numericlype = (NUMERIC|DECIMAL|DEC) [‘(‘int’,int’)’} . 

DateTimeType = (DATE | TIME | TIMESTAMP) ([IntervalField [ TO 
IntervalField ]] | [‘(‘ int ‘)’)). 

使 用 IntervalField 定义 DateTimeType 是 对 SQL 标准 的 扩充 。 


Intervallype = INTERVAL IntervalField [ TO IntervalField | . 


IntervalField = YEAR | MONTH | DAY | HOUR | MINUTE | SECOND 
(‘(‘ int 9 . 


XMLType = XML. 
DefinedType = (ROW|TABLE) Representation 
| Type ARRAY 
| Type MULTISET . 
Insert = INSERT [WITH PROVENANCE string] [XMLOption] 


INTO Table_id | Cols ] Value . 


UpdatePositioned = UPDATE [XMLOption] Table_id Assignment WHERE 
CURRENT OF Cursor_id . 


UpdateSearched = UPDATE [XMLOption] Table_id Assignment [WhereClause] . 


DeletePositioned = DELETE [XMLOption] FROM _ Table_id WHERE 
CURRENT OF Cursor_id. 


DeleteSearched = DELETE [XMLOption] FROM Table_id [ WhereClause] . 
CursorSpecification = [ XMLOption ] QueryExpression . 


QueryExpression = QueryExpressionBody [OrderByClause] 
[FetchFirstClause] . 


QueryExpressionBody = Query Term 
| QueryExpression (UNION | EXCEPT) [ ALL | DISTINCT ] 
QueryTerm . 


QueryTerm = QueryPrimary | QueryTerm INTERSECT [ ALL | DISTINCT ] 
QueryPrimary . 

QueryPrimary = QuerySpecification | Value | TABLE id . 

QuerySpecification = SELECT [ ALL | DISTINCT ] SelectList TableExpression. 

SelectList = ‘*’ | SelectItem { ‘,’ SelectItem } . 


SelectItem = Value [AS id ] . 


TableExpression = FromClause [ WhereClause ] [ GroupByClause | 
[ HavingClause ] [WindowClause] . 


FromClause = FROM TableReference { *,’ TableReference } . 

WhereClause = WHERE BooleanExpr . 

GroupByClause = GROUP BY [DISTINCT | ALL] GroupingSet {', GroupingSet}. 
GroupingSet = OrdinaryGroup | RollCube | GroupingSpec | () 


OrdinaryGroup = ColumnRef [Collate] | ‘(( ColumnRef [Collate] { ， 
ColumnRef [Collate] } ‘Y. 
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RollCube = (ROLLUP|CUBE) ‘(‘ OrdinaryGroup {', OrdinaryGroup } ‘)’ . 
GroupingSpec = GROUPING SETS ‘( GroupingSet { ', GroupingSet } ‘y . 
HavingClause = HAVING BooleanExpr . 

WindowClause = WINDOW WindowDef { *,’ WindowDef } . 

WindowDef = id AS ( WindowDetails ‘Y . 


WindowDetails = [Window_id] [PartitionClause] [OrderByClause] 
[ WindowFrame]. 


PartitionClause = PARTITION BY OrdinaryGroup . 

WindowFrame = (ROWS | RANGE) (WindowStart | WindowBetween) [Exclusion]. 
WindowStart = ((Value | UNBOUNDED) PRECEDING) | (CURRENT ROW). 
WindowBetween = BETWEEN WindowBound AND WindowBound. 
WindowBound = WindowStart | ((Value | UNBOUNDED) FOLLOWING ). 
Exclusion = EXCLUDE ((CURRENT ROW)|GROUP|TIES|(NO OTHERS)). 


TableReference = TableFactor Alias | JoinedTable 
| TableReference FOLD | TableReference INTERLEAVE 
WITH QueryPrimary. 


TableFactor = Table id [FOR SYSTEM_TIME [TimePeriodSpecification]] 
| View id 

| ROWS ‘(‘ int [ ‘,’ int ] Y 

| Table_FunctionCall 

| Subquery 

| ‘(‘ TableReference 小 

| TABLE ‘(‘ Value ‘y 

| UNNEST ‘( Value ‘y 

| XMLTABLE ‘(‘ [XMLOption] xml [PASSING NamedValue 
{', NamedValue}] Xm]lColumns ‘Y. 


ROWS(..) 是 Pyrrho〈 对 表 和 cell Hak) 的 扩展 。 


Alias = [[AS] id [ Cols ]] . 
Subquery = ‘(‘QueryExpression’)’. 
TimePeriodSpecification = AS OF Value 


| BETWEEN [ASYMMETRIC|SYMMETRIC] Value AND Value 
| FROM Value TO Value. 


JoinedTable = TableReference CROSS JOIN TableFactor 
| TableReference NATURAL [JoinType] JOIN TableFactor 
| TableReference [JoinType] JOIN ‘TableFactor USING 
(Cols) [TO *(‘Cols’)’] 
| TableReference TEMPORAL [[AS] id] JOIN TableFactor 
| TableReference [JoinType] JOIN TableReference ON 
SearchCondition . 


JoinType = INNER | ( LEFT | RIGHT | FULL ) [OUTER] . 
SearchCondition = BooleanExpr . 

OrderByClause = ORDER BY OrderSpec { ', OrderSpec } . 
OrderSpec = Value [ ASC | DESC ] [ NULLS ( FIRST | LAST )]. 
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FetchFirstClause = FETCH FIRST [ int ] (ROW|ROWS) ONLY . 
XmlColumns = COLUMNS XmlColumn { ‘,’ XmlColumn 上 
XmlColumn = id Type [ DEFAULT Value ] [ PATH str ] . 


Value = 


BinaryOp = 
VariableRef = 


ColumnRef = 


| 
MultisetOp = 


Literal = 


Literal 

Value BinaryOp Value 

~ Value 

‘( Value ‘Y 

Value Collate 

Value ‘[‘ Value 了 

ColumnRef 

VariableRef 

(SYSTEM_TIME| Period id|(PERIOD’(‘Value,Value’)’)) 
VALUE 

ROW 

Value . Member id 

MethodCall 

NEW MethodCall 

FunctionCall 

VALUES ‘(‘Value { ‘,’ Value FY {‘,’ ‘(Value {‘; Value FY} 
Subquery 

(MULTISET | ARRAY | ROW) (Value {', Value YY 
TABLE ‘(° Value’) 

TREAT (Value AS Sub_Type’)’ 

CURRENT USER 

CURRENT ROLE 

HTTP GET url_Value [AS mime_string]. 


‘+’ | | * | ‘7 | | MultisetOp . 
{Scope_id } Variable_id. 


[TableOrAlias_id .|] Column_id 
TableOrAlias_id … (POSITION| NEXT | LAST). 


MULTISET (UNION | INTERSECT | EXCEPT(ALL | 
DISTINCT). 

int 

float 

string 

TRUE | FALSE 

a Teme 

id ‘^ ^’ (Domain_id| Type_id|[Namepsace_id]’:’id| uri) 
DATE date_string 

TIME time_string 

TIMESTAMP timestamp_string 

INTERVAL [~ |] interval_string IntervalQualifier. 


IntervalQualifier = StartField TO EndField 


DateTimeField. 


StartField = IntervalField [‘( int’)’]. 
EndField = IntervalField | SECOND [‘(‘int’)’]. 
DateTimeField = StartField | SECOND [‘(‘int [‘,’ int]’)’]. 
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这 里 的 整数 表示 整 秒 数 或 秒 的 小 数 部 分 的 精度 。 


IntervalField = YEAR | MONTH | DAY | HOUR | MINUTE . 
BooleanExpr = BooleanTerm | BooleanExpr OR BooleanTerm . 
BooleanTerm = BooleanFactor | BooleanTerm AND BooleanFactor . 
BooleanFactor = [NOT] BooleanTest . 

BooleanTest = Predicate | ( BooleanExpr ”| Boolean_Value . 


Predicate = Any | At | Between | Comparison | Contains | Current | Every | Exists | 
In | Like | Member | Null | Of | PeriodBinary | Similar | Some | Unique. 


Any = ANY x [DISTINCT | ALL] Value) ‘Y FuncOpt . 
At = ColumnRef AT Value . 7 


Between = Value [NOT] BETWEEN [SYMMETRIC|ASYMMETRIC] Value 
AND Value . 


Comparison = Value CompOp Value . 

CompOp = ‘=’ | ‘<>’ | ‘<’ | ‘>’ | ‘<=’ | ‘>=’. 

Contains = PeriodPredicand CONTAINS (PeriodPredicand | DateTime_Value) . 
Current = CURRENT ( ColumnRef ‘Y. 


Current 和 At 两 类 谓词 可 用 作 时 序 表 的 时 间 列 的 默认 值 。 

Every = EVERY ( [DISTINCT|ALL] Value) ‘y FuncOpt . 

Exists = EXISTS QueryExpression . 

FuncOpt = [FILTER ( WHERE SearchCondition ‘)'] [OVER WindowSpec] . 
In = Value [NOT] IN “( QueryExpression | ( Value { ‘,’ Value } ) ‘Y . 
Like = Value [NOT] LIKE string . 

Member = Value [ NOT ] MEMBER OF Value . 

Null = Value IS [NOT] NULL. 

Of = Value IS [NOT] OF ( [ONLY] Type {‘, [ONLY] Type } “Y. 
Similar = Value [ NOT ] SIMILAR TO Regex_Value [ ESCAPE char ]. 
Some = SOME ( [DISTINCT | ALL] Value) ‘)’ FuncOpt . 

Unique = UNIQUE QueryExpression . 


PeriodBinary = PeriodPredicand (OVERLAPS|EQUALS|[IMMEDIATELY] 
(PRECEDES |SUCCEEDS) PeriodPredicand . 


FunctionCall = NumericValueFunction | StringValueFunction | 
DateTimeFunction | SetFunctions | XMLFunction | 
UserFunctionCall | MethodCall . 


NumericValueFunction = AbsoluteValue | Avg | Cast | Ceiling | Coalesce | 
Correlation | Count | Covariance | Exponential | 
Extract | Floor | Grouping | Last | 
LengthExpression | Maximum | Minimum | 
Modulus | NaturalLogarithm | Next | Nullif | 
Percentile | Position | PowerFunction | Rank | 
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Regression | RowNumber | SquareRoot | 
StandardDeviation | Sum | Variance . 


AbsoluteValue = ABS ‘(* Value ‘Y . 

Avg = AVG ‘(‘ [DISTINCT|ALL] Value) *)’ FuncOpt . 
Cast = CAST ‘(‘ Value AS Type ‘Y . 

Ceiling = (CEIL|CEILING) “( Value ‘y . 

Coalesce = COALESCE ‘(* Value {‘,’ Value } “Y 
Corelation = CORR ‘( Value ‘,’ Value ) FuncOpt . 


Count = COUNT ( **’ *y’ 
| COUNT ( [DISTINCT | ALL] Value) *)’ FuncOpt . 


Covariance = (COVAR_POP|COVAR_SAMP) ‘(‘ Value ‘,” Value ‘)’ FuncOpt . 
WindowSpec = Window_id | ‘(‘ WindowDetails ‘y . 

Exponential = EXP ‘(‘ Value ) . 

Extract = EXTRACT ‘(‘ ExtractField FROM Value ‘Y. 

ExtractField = YEAR | MONTH | DAY | HOUR | MINUTE | SECOND. 
Floor = FLOOR ( Value ) . 

Grouping = GROUPING ‘( ColumnRef { ', ColumnRef } ‘Y . 

Last = LAST [(0 ColumnRef ”OVER WindowSpec ] . 


LengthExpression = (CHAR_LENGTH|CHARACTER_LENGTH|OCTET_ 
LENGTH) ‘(‘ Value ‘)’ . 


Maximum = MAX ( [DISTINCT |ALL] Value) ‘y FuncOpt . 
Minimum = MIN “( [DISTINCT | ALL] Value) *)’ FuncOpt . 
Modulus = MOD (Value ', Value ‘Y . 

NaturalLogarithm = LN (Value ) . 

Next = NEXT [( ColumnRef ) OVER WindowSpec ] . 
Nullif = NULLIF ( Value ‘; Value ‘Y . 


Percentile = (PERCENTILE_CONT|PERCENTILE_DISC) ‘(’ Value ‘Y 
WithinGroup . 


WithinGroup = WITHIN GROUP ( OrderByClause ‘Y . 
Position = POSITION [‘(‘Value IN Value ‘)’] . 
PowerFunction = POWER “( Value ‘,’ Value ‘)’ . 


Rank = (CUME_DIST|DENSE_RANK]|PERCENT_RANK| RANK) ‘(") OVER 
WindowSpec| (DENSE_RANK|PERCENT_RANK]|RANK|CUME_ 
DIST) (Value {', Value } ‘Y WithinGroup . 


Regression = (REGR_SLOPE|REGR_INTERCEPT|REGR_COUNT|REGR_R2| 
REGR AVVGX| REGR AVGY|REGR SXX|REGR SXY| 
REGR_SYY) ‘( Value *,’ Value ) FuncOpt . 


RowNumber = ROW_NUMBER ‘(° OVER WindowSpec . 
SquareRoot = SORT ( Value ) . 
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StandardDeviation = (STDDEV_POP|STDDEV_SAMP) “( [DISTINCT |ALL] 
Value) *)’ FuncOpt . 


Sum = SUM ‘(‘ [DISTINCT |ALL] Value) ‘)’ FuncOpt . 
Variance = (VAR_POP|VAR_SAMP) ‘( [DISTINCT | ALL] Value) ) FuncOpt . 


DateTimeFunction = CURRENT_DATE | CURRENT_TIME | LOCALTIME | 
CURRENT_TIMESTAMP | LOCALTIMESTAMP . 


StringValueFunction = Normalize | Substring | RegularSubstring | Fold | 
Trim | XmlAgg . 


Normalize= NORMALIZE (Value ‘Y . 

Substring = SUBSTRING (Value FROM Value [ FOR Value ] ) . 

Fold = (UPPER|LOWER) ‘(‘ Value ‘Y . 

Trim = TRIM ‘(‘{[LEADING|TRAILING | BOTH] [character] FROM] Value ‘Y’. 
XmlAgg = XMLAGG (Value ) . 

SetFunction = Cardinality | Collect | Element | Fusion | Intersect | Set . 
Collect = COLLECT ‘(‘ [DISTINCT |ALL] Value) ‘)’ FuncOpt . 

Fusion = FUSION ‘(‘ [DISTINCT | ALL] Value) ‘)’ FuncOpt . 

Intersect = INTERSECT ‘(‘ [DISTINCT | ALL] Value) ‘)’ FuncOpt . 
Cardinality = CARDINALITY ‘( Value ) . 

Element = ELEMENT (Value ‘Y . 

Set = SET ( Value “y . 


Assignment = SET Target ‘=’ Value { ‘,’ Target ‘=’ Value } 
| SET ‘(‘ Target { ‘, Target } ) ‘=’ Value . 

Target = id i" id}. f 

SQL:2003 标准 不 支持 直接 包含 参数 表 的 目标 。 

Call = CALL Procedure_id ‘(‘ [ Value {', Value } ] “Y 
| MethodCall . 


CaseStatement = CASE Value { WHEN Value THEN Statements } 
[ ELSE Statements ] END CASE 


| CASE { WHEN SearchCondition THEN Statements } 
[ ELSE Statements ] END CASE . 
上 面 的 语句 中 至 少 要 有 一 个 WHEN FA. 


Close = CLOSE id . 
CompoundStatement = Label BEGIN [XMLDec] Statements END . 
XMLDec = DECLARE Namespace ; . 
Declaration = | DECLARE id { ‘, id } Type 
| DECLARE id CURSOR FOR QueryExpression 
[ FOR UPDATE [ OF Cols ]] 


| DECLARE HandlerType HANDLER FOR ConditionList 
Statement . 


HandlerType = CONTINUE | EXIT | UNDO. 
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ConditionList = Condition { ‘,’ Condition } . 


Condition = Condition_id | SQLSTATE string | SQLEXCEPTION | 
SQLWARNING | (NOT FOUND) . 
Fetch = = FETCH Cursor_id INTO VariableRef { ‘,’ VariableRef } . 


ForStatement = Label FOR [ For_id AS ][ id CURSOR FOR ] QueryExpression 
DG Statements END FOR [Label_id] . 
IfStatement = IF BooleanExpr THEN Statements { ELSEIF BooleanExpr 
| THEN Statements 上 [ ELSE Statements ] END IF . 


Label = [label "7. 

LoopStatement = Label LOOP Statements END LOOP . 

Open = OPEN id. 

Repeat = Label REPEAT Statements UNTIL BooleanExpr END 
REPEAT . 

SelectSingle = QueryExpresion INTO VariableRef { ‘,’ VariableRef } . 

Statements = Statement {'; Statement } . 

While = Label WHILE SearchCondition DO Statements END WHILE . 


UserFunctionCall = Id ‘(‘ [ Value {*,’ Value}] ‘)’ . 


MethodCall = Value ‘.’ Method_id [ ‘(‘ [ Value { ‘,’ Value } ] ‘)’] 
| ‘( Value AS Type ‘Y *.’ Method_id [ ‘(‘ [ Value { ‘,’ Value } ] ‘)’] 
| Type’::’ Method_id [ ‘(‘ [ Value { *,’ Value } ] ) ]. 
XMLFunction = XMLComment | XMLConcat | XMLElement | XMLForest | 
XMLParse | XMLProc | XMLRoot | XMLAgg | XPath . 


XPath 不 在 SQL:2003 标准 中 ， 但 已 非常 流行 ， 参 见 30.3.4 节 。 


XMLComment = XMLCOMMENT ‘(‘ Value ‘Y. 
XMLConcat = XMLCONCAT ‘(‘ Value {', Value } ‘Y. 


XMLElement = XMLELEMENT ‘( NAME id [ ‘ Namespace ] 
[, AttributeSpec ]{ *,’ Value } ‘)’ . 


Namespace = XMLNAMESPACES ‘( NamespaceDefault |( string AS id {‘,’ 
string AS id }) ‘)’. 

NamespaceDefault = (DEFAULT string) | (NO-DEFAULT). 

AttributeSpec = XMLATTRIBUTES ( NamedValue {', NamedValue }’)’. 

NamedValue = Value [ AS id |. 

XMLForest = XMLFOREST ‘( [Namespace ‘,”] NamedValue {', NamedValue }’)’. 

XMLParse = XMLPARSE ‘( CONTENT Value ‘Y. 

XMLProc = XMLPI ‘(‘ NAME id [‘,’ Value ] ‘)’. 

XMLForest = XMLFOREST ([Namespace ,] NamedValue {', NamedValue }')’. 

XMLParse = XMLPARSE ( CONTENT Value ‘)’. 

XMLProc = XMLPI ‘(‘ NAME id [Value ] ‘Y. 

XMLQuery = XMLQUERY ‘(‘ Value, xpath_xml 小 

XMLText = XMLTEXT’(‘ xml ‘)’. 


XMLValidate = XMLVALIDATE’(‘ (DOCUMENT |CONTENT |SEQUENCE) 
Value ‘Y. 
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数据 集成 原理 


作者 : AnHai Doan 等 译 者 : 孟 小 峰 等 中 文 版 : 978-7-111-47166-0 定价 : 85.00 元 


数据 集成 的 第 一 部 综合 指南 ， 从 理论 原则 到 实现 细节 ， 
再 到 语义 网 和 云 计算 目前 所 面临 的 新 挑战 。 
这 是 一 本 数据 集成 技术 的 权威 之 作 ， 书 中 的 大 部 分 技术 都 是 作者 提出 来 的 。 本 书 内 容 全 面 ， 很 多 技术 细节 都 介 


绍 得 非常 清楚 ， 是 数据 集成 相关 工作 人 员 的 必 读 书籍 。 
一 一 Philip A. Bernstein， 微 软 杰 出 科学 家 


本 书 的 三 位 作者 对 数据 集成 领域 都 有 重要 贡献 ， 既 有 学 术 背 景 ， 又 有 工业 界 的 经 历 。 书 中 包含 很 多 例子 和 相关 
信息 ， 以 便于 读者 理解 理论 知识 。 本 书包 含 了 现代 数据 集成 技术 的 很 多 方面 ， 包 括 不 同 的 集成 方式 、 数 据 和 模式 匹 
配 、 查 询 处 理 和 包装 器 ， 还 包括 WebB 以 及 多 种 数据 类 型 和 数据 格式 带 来 的 挑战 。 本 书 非常 适合 作为 研究 生 数 据 集 成 
课程 教材 。 

— Michael Carey， 加 州 大 学 欧文 分 校 信息 与 计算 机 科学 Bren 教 授 
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作者 : Abraham Silberschatz 等 译 者 : HRB 等 PIM: 978-7-111-37529-6 定价 : 99.007 

中 文 精 编 版 : 978-7-111-40085-1 定价 : 59.00 元 

英文 精 编 版 : 978-7-111-40086-8， 定 价 : 69.00 元 

数据 库 领 域 的 典 堂 级 作品 
夯实 数据 库 理 论 基 础 ， 增 强 数据 库 技术 内 功 的 必 备 之 选 
对 深入 理解 数据 库 ， 深 入 研究 数据 库 ， 深 入 操作 数据 库 前 具有 极 强 的 指导 作用 ! 

本 书 是 数据 库 系统 方面 的 经 典 教材 之 一 ， 其 内 容 由 浅 入 深 ， 既 包含 数据 库 系 统 基本 概念 ， 又 反映 数据 库 技 术 新 进 


展 。 它 被 国际 上 许多 著名 大 学 所 采用 ， 包 括 斯 坦 福 大 学 、 耶 鲁 大 学 、 得 克 萨 斯 大 学 、 康 奈 尔 大 学 、 伊 利 诺 伊 大 学 等 。 
我 国 也 有 多 所 大 学 采用 本 书 作 为 本 科 生 和 研究 生 数 据 库 课程 的 教材 和 主要 教学 参考 书 ， 收 到 了 良好 的 效果 。 
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Database Systems A Practical Approach to Design, Implementation, and Management Sixth Edition 


本 书 是 数据 库 领 域 的 经 典 畅 销 著作 ， 被 世界 多 所 大 学 选 为 教材 ， 同时 被 广大 技术 人 员 和 管理 者 人 
员 视 为 必 读 书 。 本 书 作者 曾 在 工业 界 致力 于 数据 库 系 统 的 设计 ， 后 进入 学 术 界 精 耕 于 教学 ， 深 请 专业 
人 士 和 非 专业 人 士 在 使 用 和 学 习 数据 库 时 的 痛 点 。 因 此 ， 本 书 采 用 这 两 类 读者 都 易于 接受 和 理解 的 方 
式 ， 全 面 介绍 数据 库 设 计 、 实 现 和 管理 的 基本 理论 、 方 法 和 技术 。 

本 书 中 文 版 分 为 “基础 篇 ”和 “ 进 阶 篇 ”， 分 别 对 应 原 书 第 一 ~ 五 部 分 和 第 六 ~ 九 部 分 。 附 好 F~ 
附录 O 为 原 书 配套 的 付费 资源 ， 有 需要 的 读者 请 联系 培 生 教育 出 版 集团 北京 代表 处 购买 ， 电 话 010- 
5735 5169/5735 5171， 电 子 邮件 service.cn@pearson.com。 参 考 文献 为 免费 资源 ， 可 访问 华章 网 站 
( www.hzbook.com ) 免费 下 载 。 


本 书 特色 

。 方 法 与 案例 。 提 供 逐 步 指导 的 数据 库 设 计 方 法 学 ， 从 概念 设计 到 逻辑 模型 再 到 物理 实现 ， 基 于 
ER 模型 并 将 规范 化 作为 验证 技术 ; 通过 贯穿 全 书 的 DreamHome 案 例 说 明 如 何 使 用 这 套 方法 
学 ， 另 有 若干 案例 可 供 学 生 选 做 。 

o 更 新 与 升级 。 扩 展 了 第 3 章 “ 数 据 库 的 结构 与 Web”， 增 加 了 云 计 算 ; 修改 了 与 SQL 相关 的 重 
节 ， 全 面 反映 新 标准 SQL:2011; 与 Oracle 相 关 的 内 容 全 部 修改 为 针对 Oracle 119; 每 章 最 后 新 
增 了 思考 题 与 习题 。 

o 形式 与 风格 。 每 章 都 采用 清晰 易 懂 的 表述 方法 ， 开 篇 明确 给 出 学 习 目标 ， 章 中 每 一 则 定义 都 用 
特殊 格式 突出 显示 ， 通 篇 使 用 大 量 示例 和 图 表 来 说 明 问 题 ， 最 后 给 出 小 结 ， 并 配 有 练习 。 
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